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Medien — Sprechen — Klang. Einführung in diesen Band 


Ines Bose, Halle (Saale) / Clara Luise Finke, Leipzig / 
Anna Schwenke, Greifswald 


Der vorliegende Band vereint empirische Untersuchungen zu Sprache und Spre- 
chen sowie zur Verknüpfung von Sprachlich-Sprecherischem mit musikalisch- 
klanglichen Elementen in den Medien (Radio, Audioguide, Hörbuch, Hörspiel so- 
wie YouTube- und Instagram-Videos). Damit knüpft er an den Sammelband „Ra- 
dio, Sprache, Klang“ (Bose (Hg.) 2015) an, in dem Zwischenergebnisse interdis- 
ziplinärer Forschungen zur „Radioästhetik — Radioidentität“ präsentiert wurden. 
Ein Großteil der Radio-Forschungen konnte bereits erfolgreich abgeschlossen 
werden, z. B. Apel (2018) zur Text- und Hörverständlichkeit von Nachrichten, 
Finke (2019) zu Identitätsangeboten und zur Alltagsästhetik in Primetime-Mode- 
rationen, Böhme (2019) zu Moderationsstilen aus Sicht von Rezipient*innen und 
Schwenke (2020) zu Nachrichtensprechstilen zwischen Formatierung und Hör- 
verständlichkeit. Andere Untersuchungen sind dazugekommen, zu Fragen des 
Kulturvergleichs, der Genderkonstruktion und der medialen Zielgruppen- und 
Formatspezifik vor allem von Radiogenres, aber auch von anderen medialen An- 
geboten. Ihre Ergebnisse werden nun im vorliegenden Band präsentiert. Einige 
Beiträge basieren auf Pilotstudien im Rahmen von Abschluss- oder Qualifikati- 
onsarbeiten, die unter der Betreuung der Herausgeberinnen entstanden sind. 


Die ersten fünf Beiträge widmen sich verschiedenen Fragestellungen der Radio- 
moderation und beleuchten unterschiedliche Perspektiven: 


Ines Bose und Golo Föllmer verknüpfen bei der Analyse standardisierter Kurz- 
moderationen in Radio-Morgensendungen unterschiedlicher Länder (Ecuador, 
Österreich, Frankreich, Deutschland) sprech-, medien- und musikwissenschaftli- 
che Perspektiven. Im Fokus der exemplarischen Studie von vier Beispielen steht, 
inwieweit bei der Interaktion von sprechsprachlichen und musikalisch-klangli- 
chen Bestandteilen rhetorische Prinzipien erkennbar sind. Es zeigt sich, dass der 
Gesamtcharakter der Kurzmoderationen erst durch das intensiv aufeinander ab- 
gestimmte Zusammenspiel der verschiedenen Bestandteile zustande kommt. Wort 
und Klang werden virtuos und variantenreich klimaktisch miteinander ver- 
schränkt. Damit sind musikalische Strukturen und klangliche Bestandteile von 
vorproduzierten Verpackungselementen und Musik und Sprechpassagen der Mo- 
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derator*innen gleichberechtigte Bestandteile einer Radiorhetorik. Das Verhältnis 
zwischen den sprechsprachlichen Moderationsanteilen und der Verpackung vari- 
iert je nach Programmsituation und angewendeter produktionstechnischer Raffi- 
nesse. 


Grit Böhme und Sonja Kettel untersuchen die Wirkung von Radiomoderationen 
auf Hörer*innen im Kulturvergleich. Ausgangspunkt ist die Beobachtung, dass 
Radioprogramme einerseits meist auf die Bedürfnisse lokal definierter Zielgrup- 
pen zugeschnitten sind und dass Radio andererseits ein globalisiertes Medium ist, 
das in der Programmgestaltung weltweit stark geprägt ist durch das US-amerika- 
nische Formatradio und die BBC. Anzunehmen ist deshalb, dass sich dies auch 
auf die Gestaltung des Programmelements Moderation auswirkt. Die Autorinnen 
untersuchen, wie Radiohörer*innen verschiedener Länder und Kulturen Formate 
und Stile kategorisieren und bewerten. Exemplarisch wurden kanadische Radioh- 
örer*innen, die zwar fließend Deutsch sprechen, aber nicht in Deutschland und 
mit dessen Radiolandschaft sozialisiert sind, anhand von Moderationsstimuli nach 
ihren Bewertungen deutscher Radiomoderationen befragt (teilstrukturiertes Inter- 
view-Verfahren). Die Ergebnisse wurden anschließend mit den Ergebnissen von 
Hörer*innengruppen einer Studie von Böhme (2019) zu denselben Stimuli vergli- 
chen, die mit deutschsprachigen und in Deutschland sozialisierten Probanden 
durchgeführt wurde. Im Beitrag werden ausgewählte Ergebnisse sowie Ähnlich- 
keiten und Unterschiede in den Beschreibungen der verschiedenen Hörer*innen- 
gruppen aufgezeigt und diskutiert. Es zeigt sich, dass Formatierung und Zielgrup- 
penspezifik überregional erkannt werden und dass Hörgewohnheiten bzw. - 
vorlieben größeren Einfluss auf die Bewertungen haben als Länderzugehörigkei- 
ten. 


Jasmin Galonski und Clara Luise Finke wenden sich Gender-Konstruktionen 
in den Moderationen von Radio-Morningshows zu. In dieser meistgehörten und 
prestigereichen Sendestrecke ist eine vornehmlich männliche Besetzungspolitik 
festzustellen, in der sich zudem eine Inszenierung stereotyper Geschlechterrollen- 
bilder abzeichnet. Zunächst wird der Gender-Begriff definiert und in Bezug auf 
Interaktionen erörtert. Anhand einer Stichprobe von Mehrfach-Moderationen aus 
zwanzig Sendern werden Relevanz und interaktive Konstruktionsmechanismen 
von Geschlecht in Doppel-Moderationen analysiert und es wird differenzierend 
herausgearbeitet, wie sich hierarchisch oder gleichberechtigt angelegte Funkti- 
onsrollen (Anchor vs. Sidekick oder Anchor vs. Anchor) innerhalb der Modera- 
tor*innen-Teams auf die Konstruktion von Geschlechterrollenbildern auswirken. 
Die Analysen ergeben, dass das gesellschaftlich grundlegende Dichotom „Mann- 
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Frau“ ein wichtiges stilistisches Mittel innerhalb von Mehrfach-Moderationen zur 
Kontrastierung der Moderierenden darstellt. Insgesamt zeigt sich, dass die in der 
Radio-Primetime inszenierten Konzepte des „Doing Gender“ und „Doing Hete- 
ronormativity‘“ einen konservativen, heteronormativen Gesellschaftsdiskurs ab- 
bilden, in welchem einer Diversität von Gender-Identitäten und sexuellen Orien- 
tierungen keine Geltung zukommt. 


Riccarda Funk beschäftigt sich mit der Frage, ob Radiomoderator*innen Stimm- 
umfänge und Melodieverläufe als Mittel für typisch „weibliches“ und „männli- 
ches“ Sprechverhalten in Morningshows einsetzen. Dafür analysiert sie in einer 
Pilotstudie, ob der phonetisch messbare Stimmumfang und die akustisch hörbaren 
Melodievariationen von Radiomoderatorinnen größer sind als von Radiomodera- 
toren. Anhand von jeweils drei Moderationsabschnitten aus Morningshows eines 
öffentlich-rechtlichen und eines privaten Senders untersucht sie zudem den Ein- 
fluss des Senderformats. Vorbehaltlich der sehr kleinen Stichprobe kommt die 
Autorin zu dem Ergebnis, dass die verwendeten Stimmumfänge und Melodiever- 
läufe eher sender- als genderspezifisch sind. In den untersuchten Abschnitten wer- 
den sie offensichtlich nicht als Marker für typisch „weibliches“ und „männliches“ 
Sprechverhalten benutzt, sondern scheinen ein radiotypisches Sprechmuster auf- 
zuzeigen. 


Thomas Wilke thematisiert informelle Bildungsprozesse im Radio, für die neben 
den Aspekten Vermittlung, Ressourcen, Vorwissen und Motivation auch schwer 
quantifizier- und messbare Faktoren wie Vertrauen, Authentizität, Respekt und 
Autorität charakteristisch sind. Er nimmt dafür das 2018 gestartete Hamburger 
HipHop-Webradio Say Say — Soulful HipHop Radio in den Blick. Dieses noch 
junge Radioangebot spricht jugend- und popkulturell ein breites Publikum an, ist 
aufgrund seiner charakteristischen Musikfarbe (englischsprachiger HipHop, Funk 
und Soul der 70er Jahre bis zur Gegenwart) jedoch als Nischen-Programm einzu- 
ordnen. Zunächst verortet der Autor den Sender innerhalb der digitalen Audio- 
und Webradiolandschaft und analysiert dann die moderierte Morningshow. Er 
fragt, warum bestimmte Medienangebote auch als ganz spezifische, informelle 
Bildungsangebote („educated radio“) verstehbar sind, und demonstriert das ins- 
besondere am „Sample des Tages“. Wilke kennzeichnet diese wiederkehrende re- 
daktionell aufbereitete Rubrik als radiophone Plattform, die den Hörer*innen mit 
einer spezifischen Ästhetik detailreich und tiefgründig sowohl den Zugang zu 
Musik als auch Hintergrundwissen und Kontextualisierung vermittelt und 
dadurch ein geschultes, emphatisches Hören ermöglicht. Der Moderator ver- 
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knüpft Hingabe zur Musik und zur HipHop-Kultur mit kultureller Multiplikato- 
renrolle in einer spezifisch medialen Form. 


Die folgenden vier Beiträge widmen sich der formatspezifischen Beschreibung 
von sprachlichen und sprecherischen Merkmalen in Radionachrichten. 


Heiner Apel und Anna Schwenke kennzeichnen den Sprach- und Sprechstil von 
Radionachrichten als advance organizer, der beim Erfüllen rezipienteninhärenter 
Erwartungen die Verständlichkeit der Nachrichten erhöhen kann. Anhand aktuel- 
ler Ergebnisse sprechwissenschaftlicher Hörverständlichkeits- und Sprechstilfor- 
schung wird das advance organizer-Prinzip anhand von Radionachrichten disku- 
tiert, insbesondere im Hinblick auf radiorhetorische Fragen nach Angemes- 
senheit, Zielgruppenorientierung und Wiedererkennbarkeit. Abschließend wer- 
den Untersuchungsfragen formuliert, die konkrete Anknüpfungspunkte für wei- 
tere Forschungen darstellen. Damit wird das sprechwissenschaftliche Feld für 
eine umfassende Beschreibung und systematische Auseinandersetzung mit 
sprach- und sprechstilistischen Merkmalen authentischer Radionachrichten um- 
rissen. 


Valentina Sergeeva und Ines Bose geben einen schlaglichtartigen Überblick 
über die historische Entwicklung der Radionachrichten in Russland, wobei der 
Fokus auf dem Sprechstil liegt. Dabei wird ein Bogen von der Anfangsphase der 
Radioübertragung in Russland 1895 über das Radio in der Sowjetunion bis zum 
russischen Radio unter Marktbedingungen von 1990 bis heute gespannt. Da es 
kaum einschlägige Publikationen gibt, ziehen die Autorinnen als Quellen Einzel- 
funde und Beschreibungen zu typischen Nachrichtensprechmustern bestimmter 
Epochen heran, darüber hinaus Anforderungskataloge ans Nachrichtensprechen 
aus Sicht von Radioschaffenden und Sprechtrainer*innen, Charakteristika be- 
rühmter Radiosprecher*innen sowie öffentlich zugängliche Audiobeispiele. 


Daran anknüpfend stellt Valentina Sergeeva eine laufende empirische Untersu- 
chung zu Nachrichtensprechstilen im aktuellen russischen Radio vor. Die Unter- 
suchung umfasst sowohl auditiv-akustische Nachrichten-Untersuchungen als 
auch Hörexperimente mit russischen und deutschen Radiohörer*innen zur For- 
matidentifikation. Zunächst wird das Korpus von Nachrichten unterschiedlicher 
Senderformate vorgestellt und charakterisiert, danach wird über die Hörexperi- 
mente zur Formatidentifikation berichtet. Die Selbstpositionierungen der russi- 
schen Radiosender im Internet zeigen, dass hinsichtlich des Formatbezugs für rus- 
sische Radionachrichten ähnliche Formatkategorien wie für deutsche oder 
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amerikanische gelten. Das Hörexperiment anhand ausgewählter Nachrichtenmel- 
dungen zeigt, dass die Anmutung aktueller russischer Radionachrichten mittels 
Sprechstil und Hintergrundmusik so eindeutig gestaltet ist, dass der Nachrichten- 
klang und der Formatbezug unabhängig vom Sprachverständnis deutlich erkenn- 
bar werden. 


Johanne Gerhardt und Anna Schwenke legen eine Pilotstudie zur Analyse bar- 
rierefreier Informationsangebote im öffentlich-rechtlichen Radio vor, indem sie 
zehn nachrichtenleicht-Meldungen des Deutschlandfunks im Hinblick auf ausge- 
wählte sprachliche und sprecherische Merkmale beschreiben. Diskussionsgrund- 
lage bildet das Konzept Leichte Sprache im Bezug zu sprechwissenschaftlichen 
Untersuchungen zur Hörverständlichkeit von Radionachrichten. Vorbehaltlich 
der sehr kleinen Stichprobe kommen die Autorinnen zu dem Ergebnis, dass die 
Meldungstexte als hörverständlich, die sprecherischen Realisierung jedoch nur als 
bedingt hörverständlich zu bewerten sind. Da sich die angelegten sprechwissen- 
schaftlichen Analysekriterien von Formulierungsprinzipien ableiten, die sich auf 
die hörverständliche Informationsvermittlung für ein breites Publikum ohne 
sprachlich-kognitive Beeinträchtigungen beziehen, regen die Autorinnen an, an- 
hand von Wirkungstests empirisch zu prüfen, ob die sprechwissenschaftlichen 
Hörverständlichkeitskriterien für die spezielle(n) Zielgruppe(n) barrierefreier 
Nachrichten strenger ausgelegt werden sollten und ob weitere Kriterien hinzu- 
kommen müssten, um sie als barrierefrei hörverständlich einstufen zu können. 


Daran schließt der Beitrag von Heiner Apel, Ines Bose und Anna Schwenke an. 
Die Autor*innen stellen zunächst fest, dass die öffentlich-rechtlichen Radiosen- 
der, die barrierefreie Inhalte zu Verfügung stellen, sich bisher vor allem auf die 
Herstellung von Schrifttexten konzentrieren und dass sie sich dabei an entspre- 
chenden Regelwerken orientieren. Da diese barrierefreien Texte oft auch als Au- 
dios präsentiert werden, sollten analog zu schriftsprachlichen Regeln auch ent- 
sprechende Regeln für die mündliche Präsentation erarbeitet werden. Dazu 
können sprechwissenschaftliche Erkenntnisse beitragen, die auf empirischen For- 
schungen zum hörverständlichen Vorlesen beruhen. Es wird aus einer Wissen- 
schafts-Praxis-Kooperation mit dem MDR berichtet, in der zurzeit Standards für 
hörverständliche Nachrichtensendungen in Leichter Sprache erarbeitet und getes- 
tet werden. Darüber hinaus werden wissenschaftlich basierte Regeln zum barrie- 
refreien Vorlesen thesenartig präsentiert, aber auch offene Fragen formuliert. In- 
sofern bildet der Beitrag stärker als viele andere in diesem Band eine Brücke von 
wissenschaftsbasierten Analysen zur berufspraktischen Anwendung im Medien- 
alltag. 
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Abgeschlossen werden die Beiträge zum Radio mit der Untersuchung von Flo- 
rian Eib und Ines Bose zu Fußballreportagen. Die Fußballreportage ist die po- 
pulärste Form der Sportreportage in Deutschland. Die Reporter*innen sollen ein 
Spiel möglichst umfassend und nachvollziehbar beschreiben und einordnen sowie 
das Spielgeschehen vor Ort für die anvisierte Zielgruppe und im Sinne des Sen- 
derformats lebendig und empathisch vermitteln. Eib und Bose kennzeichnen zu- 
nächst das Genre und analysieren dann sechs Fußballreportagen unterschiedlicher 
Senderformate zu demselben Bundesligaspiel. Dabei legen sie den Fokus auf die 
sprachliche und sprecherische Gestaltung unterschiedlicher Spannungsphasen des 
Spiels in Bezug auf Senderformat und Zielgruppenorientierung. Die Analyseer- 
gebnisse werden verknüpft mit Selbstauskünften der Reporter zu ihrem berufli- 
chen Selbstverständnis und mit Praxiserfahrungen des Autors, der selbst als Fuß- 
ballreporter tätig ist. Die vergleichende Untersuchung legt den Schluss nahe, dass 
Fußballreportagen sprachlich und sprecherisch insgesamt ein sehr stabiles Genre 
darstellen. Die untersuchten Reporter agieren nach erworbenen genretypischen 
Mustern, die sie durch individuelle Nuancen nur leicht modifizieren. Je nach Ziel- 
publikum und Senderformat zeigen sich aber auch Unterschiede in der inhaltli- 
chen Fokussierung und sprachlichen Gestaltung der Reportagen. 


Die weiteren Beiträge beschäftigen sich mit unterschiedlichen medialen Formen 
außerhalb des Radios. Sie untersuchen das medial vermittelte Sprechen im Hör- 
buch und in Museums-Audioguides für Kinder sowie stimmlich-sprecherische 
Phänomene und Anforderungen bzw. Wirkungen im Hörspiel und in YouTube- 
Lernvideos. 


Anne Nieper widmet sich dem Hörbuch, das sich einer wachsenden Beliebtheit 
erfreut und diverse Genres von Belletristik und Lyrik, über Sachliteratur und Rat- 
geber bis hin zu Sprachkursen umfasst. Hinsichtlich der sprecherischen Produk- 
tionsweise dominiert auf dem deutschen Markt das vorgelesene Hörbuch. Es exis- 
tieren jedoch einige wenige Produktionen, die andere sprecherische Produktions- 
weisen aufweisen und dadurch aus der Masse der vorgelesenen Hörbücher her- 
vorstechen. Zu diesen Sonderformen des Hörbuchsprechens zählt das freie 
Sprechen, das die Autorin als Alternative zum Vorlesen aufgreift. Zunächst be- 
schreibt sie Charakteristika des Vorlesens und des freien Sprechens und vergleicht 
sie miteinander. Dann analysiert sie exemplarisch ein prominentes Beispiel des 
österreichischen Autors, Musikers und Hörbuchsprechers Michael Köhlmeier, der 
mit seinen frei gesprochenen Hörbuchproduktionen große Bekanntheit erlangt hat 
und ein beinahe einzigartiges Phänomen auf dem Hörbuchmarkt darstellt. 
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Lina Krüger stellt eine Pilotstudie zur adressatengerechten Informationsaufbe- 
reitung in Museums-Audioguides für Kinder vor. Zunächst erläutert die Autorin 
Kennzeichen einer speziell auf die Bedürfnisse von Kindern zugeschnittenen In- 
formationsaufbereitung und setzt diese in Beziehung zu verschiedenen Formen 
von Museums-Audioguides. Dann analysiert Krüger sieben speziell für Kinder 
konzipierte Audioguides deutscher Museen hinsichtlich ihrer Audioqualität, Ma- 
krostruktur und Erzählweise, den Charakteren sowie der sprachlichen und spre- 
cherischen Gestaltung im Hinblick auf die kindgerechte Informationsaufberei- 
tung. Als besonders typisch für die Inhaltsvermittlung erweist sich das Story Tel- 
ling. In den tragenden Rollen werden häufig Kinder eingesetzt, die den kindlichen 
Rezipient*innen eine potenzielle Projektionsfläche zur Identifikation bieten. Ano- 
nymität und bloßes Informieren werden vermieden, stattdessen wird Wert gelegt 
auf Personalisierung und die Schaffung einer persönlichen Beziehung. Alle un- 
tersuchten Audioguides sind durch eine einfache und anschauliche Sprache ge- 
kennzeichnet (einfacher Satzbau, Verbalstil, Erklärung von Fachwörtern). Cha- 
rakteristisch für die sprecherische Gestaltung ist ein variabler, lebendig wirkender 
Sprechstil. 


Maria Naumann wendet sich den stimmlichen Anforderungen im Hörspiel zu. 
Zunächst betont sie, dass das Hörspiel in seiner langen Tradition als Kunstgattung 
auch die Entwicklung von Stimmmoden und eine Veränderung der Anforderun- 
gen an Hörspielsprecher*innen nachvollzogen hat und dass die verschiedenen 
Formen des Hörspiels eine Vielzahl an stimmlich-sprecherischen Realisierungs- 
möglichkeiten geprägt haben (von theatralisch-literarischen Ansätzen über offene 
Darstellungsarten hin zu Verbindungen mit der akustischen Kunst). Dann stellt 
Naumann eine Pilotstudie vor, in der sie Interviews mit sieben Hörspielverant- 
wortlichen von öffentlich-rechtlichen Rundfunkanstalten durchgeführt hat. Die 
interviewten Expert*innen berichten, wie die Suche nach Hörspiel-Sprecher*in- 
nen erfolgt, nach welchen Kriterien diese engagiert werden, welche aktuellen An- 
forderungen sie an Hörspielstimmen stellen und welche Funktionen sie ihr zu- 
schreiben. Ein Ergebnis der Befragung ist, dass im Hörspiel die Hauptfunktionen 
der Stimme die Erzeugung einer gewünschten Wirkung und die Einladung zum 
Hin- und Weiterhören sind. Die Expert*innen erwarten in der Zusammenarbeit 
mit Sprecher*innen außerdem Wandlungsfähigkeit, Präzision, professionellen 
Umgang mit der eigenen Stimme und dem Mikrofon sowie eigene Gestaltungs- 
ideen. 
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Alexandra Ebel und Lena Schotters fokussieren die sozialen Medien Instagram 
und YouTube. Sie gehen davon aus, dass in der Kommunikation über Social Me- 
dia alle zu potenziellen Produzent*innen werden können und dass positive Be- 
wertungen durch andere Nutzer*innen über den Erfolg eines Beitrags entschei- 
den. Die Autorinnen stellen zwei Pilotstudien zum Einfluss von Sprech- 
ausdrucksparametern auf die Zuschreibung von Authentizität sowie auf den Er- 
folg einzelner Social-Media-Ereignisse vor. In der ersten Studie wird mittels einer 
Fragebogenerhebung anhand vorgegebener (In-)Authentizitätskriterien unter- 
sucht, ob User*innen den Akteur*innen zweier Instagram-Stories Authentizität 
zuschreiben und inwiefern dafür Sprechausdrucksmerkmale verantwortlich ge- 
macht werden können. Vorbehaltlich der sehr kleinen Stichprobe zeigt sich, dass 
Sprecher*innen, deren Sprechweise geschult wirkt, als weniger authentisch wahr- 
genommen werden. In der zweiten vorgestellten Studie wird mittels einer auditiv- 
phonetischen Analyse untersucht, ob der Erfolg von YouTube-Lernvideos zu 
schulisch oder universitär relevanten Themen mit bestimmten Ausprägungen von 
Sprechausdrucksmerkmalen in Zusammenhang steht, die in erfolgreichen Videos 
häufiger zu finden sind als in weniger erfolgreichen Videos. Hier zeigt sich, dass 
diejenigen Lernvideos erfolgreicher (bezogen auf Klickzahlen und Userkommen- 
tare) sind, in denen Sprecher*innen mit geschulten Stimmen zu hören sind. 


Die Mehrzahl der Beiträge dieses Bandes enthält Datenbeispiele in Form von 
Transkripten und Audios. Zum Auffinden der Audios in einem Beitrag werden 
jeweils ein QR-Code und ein Hyperlink angegeben. Die Transkriptionen orientie- 
ren sich sämtlich am Gesprächsanalytischen Transkriptionssystem GAT 2 (Sel- 
ting et al. 2009). In einigen Transkripten sind die Sprecheinheiten, die durch au- 
ditiv wahrnehmbare Einschnitte (z. B. Sprechpausen oder starke phonetische 
Kontraste) voneinander abgegrenzt werden, zusätzlich als prosodisch nicht abge- 
schlossen (|) bzw. abgeschlossen (||) vermerkt. 
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„Et à tout a l’heure! sSSWOOSH>“ 
Rhetorizität hybrider Radioprodukte 


Ines Bose / Golo Föllmer, Halle (Saale) 


Im Beitrag wird am Beispiel von standardisierten Sendebestandteilen in Radio- 
Unterhaltungssendungen untersucht, inwieweit im Radio musikalisch-klangliche 
und sprechsprachliche Elemente nach rhetorischen Prinzipien interagieren. Spe- 
ziell geht es um zwei hybride Radioprodukte, den Three Element Break (3EB) 
und den Service- / Informationsblock in Radio-Morgensendungen zur Primetime. 
Dabei werden medien- und musikwissenschaftliche Fragestellungen mit sprech- 
wissenschaftlichen verknüpft. Es zeigt sich, dass die Rhetorizität des Radios sich 
nicht nur auf die sprachlich-sprecherische Gestaltung von Alltagsradio erstreckt, 
sondern vorproduzierte Verpackungselemente und Musik gleichermaßen rheto- 
risch eingesetzt werden und das Rhetorische damit weit in musikalische und 
klangästhetische sowie in apparative, produktionstechnische und den Sendeablauf 
betreffende Strukturen hineinreicht. Ein Vergleich der Funktionen des sog. Three 
Element Break als Teil der Moderation und der verwendeten Verpackungen als 
Teil vorproduzierter Rahmungselemente legt nahe, dass eine kategorische Tren- 
nung zwischen diesen Elementen in der Praxis nicht aufrecht zu erhalten ist. 


1 (Radio-)Rhetorik 


Wenn man Rhetorik als Methodenlehre vom wirksamen Sprechen auffasst, aus- 
gestattet mit einer rhetorischen Téchne i. S. einer reflektierten Zweck-Mittel-Re- 
lation (vgl. z. B. Gutenberg 2001, Hannken-Illjes 2004), dann kann auch Radio 
als rhetorische Praxis aufgefasst werden (vgl. Bose / Föllmer 2015, Finke 2019, 
Schwenke 2020). Radioformate sind sorgfältig durchgeplant: In Stylebooks sind 
möglichst alle Komponenten der Anmutung festgelegt, in Redaktionskonferenzen 
werden alle Einzelheiten einer Sendung diskutiert und geplant, über eine „Stun- 
denuhr“ wird die Einhaltung des geplanten Ablaufs während der Präsentation ge- 
sichert und die Präsentator*innen kontrollieren ihr Verhalten genau. Rhetorizität 
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zeigt sich dabei nicht nur an Aufbau, Struktur und Präsentation verbaler Sende- 
anteile, sondern erstreckt sich auch auf nichtsprachlich-klangliche Anteile (z. B. 
Bumper, Soundeffekte, Show Opener, Stinger, Musikbetten). 


Multimodale Rhetorikkonzepte 

Es ist ein alter rhetorischer Grundsatz, dass neben dem Sprachlichen auch das Wie 
des Vortrags, die sprecherische und körperliche Präsentation, einen wichtigen 
Beitrag leistet — auch wenn die „stimmliche und körperliche Beredsamkeit“ in- 
nerhalb der Rhetorik zu verschiedenen Zeiten unterschiedliche Aufmerksamkeit 
erfahren hat (Steinbrink 1992; Campe / Wilczek 2009; Schulz 2014). Seit der An- 
tike werden sprecherische Gestaltungsmittel wie Stimme, Lautheit, Sprechge- 
schwindigkeit, Rhythmus und Pausen (figura vocis) zusammen mit körperlichen 
Gestaltungsmitteln wie Haltung, Gestik, Mimik und Atemtechnik (motus corpo- 
ris) in den rhetorices partes als rednerische Praxis, als Kategorie der actio bzw. 
pronuntiatio, und damit multimodal gefasst (Auctor ad Herennium 1998; Cicero 
2007). In der aktuellen rhetorischen Forschung findet sich dieses Interesse an 
Multimodalität innerhalb der Sound Studies und der Rhetorik unter der Über- 
schrift sonic persuasion (Gunn 2007; Goodale 2011; Gunn et al. 2013). Auch in 
der aktuellen linguistischen Gesprächsforschung wird die Multimodalität von 
Kommunikation zunehmend berücksichtigt (z. B. Mondada / Schmitt 2010; Sch- 
mitt 2015; Hausendorf et al. 2016). Ausgehend von der Annahme, dass jedes kom- 
munikative Ereignis situiert ist, werden insbesondere Beschreibungen gefordert, 
die den „Beitrag aller verfügbaren Handlungsressourcen zur Sinnkonstitution und 
ihr Zusammenspiel im interaktiven Geschehen“ in den Blick nehmen (Dausend- 
schön-Gay et al. 2015, 33). Grawunder et al. (2017, 8) plädieren für eine Analyse 
mündlichen rhetorischen Handelns an der Schnittstelle zwischen Rhetorik und 
Phonetik, wobei Konzepte und Methoden produktiv aufeinander zu beziehen sind. 
Nur mit einem solchen interdisziplinären Blick können demnach „die persuasiven 
Mittel, Verfahren und deren Funktionen innerhalb eines mehrdimensionalen, dy- 
namischen, interaktiven situativ gerahmten rhetorischen Ereignisses“ adäquat er- 
fasst werden (ebd.). 


Musikalische Rhetorikkonzepte 

Die westliche Musiktheorie weist viele Bezüge zwischen musikalischen und 
sprachlich-rhetorischen Konzepten auf. Krones (1997) unterscheidet diese unter 
Bezug auf Forkels „Allgemeine Geschichte der Musik“ aus dem Jahr 1788 in fünf 
Bereiche: 1) eine musikalische Periodologie, aus der sich Möglichkeiten und Be- 
dingungen der Erzeugung abgeschlossener zeitlicher Einheiten oder Phrasen er- 
geben; 2) eine Lehre musikalischer Stile bzw. „Schreibarten“, die z. B. Epochen 
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oder regionale Schulen differenziert; 3) einen Fundus musikalischer Gattungen, 
die sich u. a. aufgrund ihrer jeweiligen Instrumentation und ihres Aufführungs- 
kontextes unterscheiden; 4) dann die zentrale Kategorie der „Anordnung musika- 
lischer Gedanken [...] nebst der Lehre von den Figuren“ (Forkel 1788, 39); 5) 
schließlich die Art des Vortrags bzw. der „Declamation der Tonstücke“ (ebd.). 


Den fünf Bereichen vorgeschaltet ist nach Forkel eine vor-rhetorische Grammatik 
als Regelwerk für die Zusammenfügung einzelner Töne und Harmonien zu Wör- 
tern und Sätzen, die u. a. vorgibt, welche Zusammenklänge, Intervalle oder paral- 
lele Fortschreitungen mehrerer Stimmen möglich sind. Als musikalisch-rhetori- 
sche ’Figuren’ wurden schon seit dem 17. Jahrhundert Abweichungen von der 
Satztechnik des Kontrapunkts verstanden, die entweder als Ausschmückung (or- 
natus) dienen oder einen inhaltlichen Zweck verfolgen, d. h. Bilder, Emotionen 
oder konkrete Inhalte transportieren und damit Affekte darstellen oder erregen 
sollen (Krones 1997, Sp. 826f.). Ein auf diesen Grundlagen gebildeter „Satz“ (hier 
im sprachlichen Sinne, also nicht im Sinne von Formkategorien wie „Sonaten- 
satz“) bildet die „kleinste Einheit der musikalischen ’Unterredung’“ (a. a. O., Sp. 
818) und konstituiert sich wie in der Sprache aus Subjekt und Prädikat, d. h. aus 
einem prägnanten Motiv und dessen Art des Auftretens, Erscheinungsweise oder 
Charakter (ebd.). 


Nach Auhagen (2014, 26) fasste Burmeister verschiedene Typen von „Figuren“ 
1606 in einer Figurenlehre zusammen, die einzelne Affektausdrücke bestimmten 
Figuren mit hervorstechendem melodischem oder harmonischem Gepräge zuord- 
nete. Matheson sah die figurenhafte Ausschmückung einer Melodie 1739 weniger 
als Aufgabe des Komponisten denn des Interpreten. Bei dieser Aufgabe könnten 
„die haeuffigen Figuren oder Verbluemungen aus der Redekunst, wenn sie wol 
angeordnet werden, vornehmlich gute Dienste leisten.“ (Matheson 1739, 242). 
Das achte Kapitel von „Der Vollkommene Capellmeister“ überschreibt Matheson 
gar mit „Von der Melodien Einrichtung, Ausarbeitung und Zierde“ und stellt so 
einen direkten Bezug zur rhetorischen Schrittfolge dispositio, elaboratio und de- 
coratio her (vgl. dazu ausführlich Auhagen 2014, 27). 


Ein Beispiel dafür ist die melodische Figur des großen aufsteigenden Intervalls, 
das analog zur Ekphonesis bzw. Exclamatio als emotionaler Ausruf die Forderung 
nach Aufmerksamkeit ausdrückt. Ist es als große Sext au7geführt, wird es in der 
Regel mit positiven Emotionen wie freudige Erwartung oder dem Auftreten eines 
herbei ersehnten Charakters verbunden (Krones 1997). Diese Figur charakterisiert 
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z. B. das Leitmotiv von Jill (Claudia Cardinale) im Western-Klassiker „Once u- 
pon a time in the West“ (dt. „Spiel mir das Lied vom Tod“, Sergio Leone 1968). 
Im Moment höchster Emphase sind sogar zwei Sexten in Folge verkettet. Die auf- 
steigende kleine Sext wird dagegen eher als elegischer, sehnsuchtsvoller Aus- 
druck gehört, die None gar als Ausdruck von Schmerz, alle großen aufsteigenden 
Intervalle aber als Ausruf, der Aufmerksamkeit einfordert. Ein Beispiel für eine 
harmonische Figur ist der verminderte Septakkord, der für den Zweifel steht (Kro- 
nes 1997). 


2 Sendebestandteile in Radio-Unterhaltungsformaten 


Radiosendungen bestehen üblicherweise aus gesprochenem Wort, Musik und 
Sendeverpackung. Hauptmotor von Unterhaltungssendungen ist die Musik; die 
Wortanteile in Radiosendungen verteilen sich u. a. auf Nachrichten, Moderation 
und Service. In Morgensendungen ist dieses Konglomerat aus Musik, Nachrich- 
ten, Moderation und Service deutlich stärker auf Unterhaltung und Aufmerksam- 
keit ausgerichtet als im restlichen Tagesprogramm der Sender (für einen Über- 
blick vgl. Finke 2019, 19 ff.; La Roche / Buchholz 2017, 88). Sendungen zur 
morgendlichen Primetime zwischen 06.00 und 09.00 Uhr und wollen die Hö- 
rer*innen nach dem Aufstehen aktivieren, damit diese unbeschwert in den Tag 
starten können. Sie verbreiten vor allem gute Laune, liefern aber auch notwenige 
Informationen wie Wetter und Verkehrslage und berichten über die wichtigsten 
Ereignisse. Morgensendungen zählen zu den wichtigsten, hörerstärksten Sendun- 
gen eines Senders und werden deshalb mit viel Aufwand gestaltet und beworben: 
„Philosophie, Themen und inhaltliche Mischung des Senders (Unterhaltungs- 
oder Informationsschwerpunkt, Verhältnis von Musik- und Wortanteil, Einsatz 
von Comedy, Musikbett etc.) sollen klar erkennbar sein und die angestrebte Hö- 
rerzielgruppe soll zur Identifikation mit dem Sender eingeladen werden.“ (Finke 
2019, 20). 


Die Musik stellt in vielen Radioformaten den zentralen Programmbestandteil dar. 
Im Durchschnitt aller Sender in Deutschland macht sie weit über die Hälfte der 
Sendeinhalte aus (Gushurst 2000; Schramm 2008, 37). Das lässt sich vor allem 
dadurch erklären, dass die Musik zugleich den wichtigsten Zuwendungsgrund zu 
einem bestimmten Radioprogramm darstellt: Menschen hören in erster Linie des- 
wegen einen bestimmten Sender, weil dort eine bestimmte Musik gespielt wird. 
Dabei ist bedeutsam, dass Radio überwiegend als Begleitmedium genutzt wird, d. 
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h. parallel zu Tätigkeiten wie Hausarbeit, beruflichen Aufgaben, Essen oder Au- 
tofahren (Schramm 2008, 39). In dieser Begleitrolle erfüllt das Radio in Abhän- 
gigkeit von der aktuellen Situation und den individuellen Bedürfnissen der Nut- 
zer*innen unterschiedliche Funktionen. Neben dem Bedürfnis nach Information 
und nach parasozialen Beziehungen zu Radiomoderator*innen richten sich die 
Bedürfnisse primär auf die gespielte Musik (Schramm / Hofer 2008, 113). Unter 
anderem sind dies Stimmungsregulation, Erregungsstimulation, Abschalten des 
Kopfes, Tagträumen und das Gefühl der Zugehörigkeit zu antizipierten Radiohö- 
rer*innen desselben Programms und Lebensstils (Schramm 2008, 40), die sich 
neben nichtmusikalischen sendertypischen Merkmalen wie Themenauswahl und 
Sprechweise wesentlich über den angesprochenen Musikgeschmack äußern. 


Wortbeiträge unterbrechen den Musikfluss und werden im deutschen Radio-Jar- 
gon deshalb häufig als „Break“ bezeichnet (In den USA sind damit in der Regel 
Werbepausen gemeint.). Der Begriff betont, dass die Musik als „eigentlicher“ 
Programminhalt verstanden wird, und hebt die Notwendigkeit hervor, diese Un- 
terbrechung des Broadcast Flow möglichst sacht zu gestalten und durch anre- 
gende Inhalte sowie Sprechweise Aufmerksamkeit zu erzeugen. Eichmann (2012, 
249) empfiehlt daher in seiner „Checkliste für eine gute Moderation“ den Mode- 
rator*innen folgende „Testfrage bei der Vorbereitung: Werde ich es so schaffen, 
dass der Hörer dranbleibt?‘“. Wann Breaks stattfinden, ist bei Formatradios präzise 
in der Sendeuhr festgelegt (ebd., 261). 


Die Moderation lenkt mit verbindenden Worten von einem Programmelement 
zum andern und hat damit vorwiegend „eine strukturierende, verknüpfende und 
Orientierung gebende Funktion“ (Finke 2019, 17). Die Moderation trägt wesent- 
lich zur Wiedererkennbarkeit eines Programms bei und sorgt im besten Fall für 
eine Hörerbindung (Buchholz 2017, 304; Finke 2019, 20). Denn die Modera- 
tor*innen sind „Repräsentanten der jeweiligen Welle. Hörer identifizieren sich 
mit ihren Lieblingssendern nicht selten über die Moderatoren.“ (Pawlowski 2004, 
9). 


In Unterhaltungsformaten sind wesentliche Aufgaben von Moderator*innen die 
Vermittlung von guter Laune und Zuversicht, optimistischer Ansprache und Le- 
bensfreude. Dabei greifen Moderator*innen insbesondere Alltagsthemen in einer 
zu Sender und Zielgruppe passenden Weise auf. Sie thematisieren und interpre- 
tieren das Alltagsgeschehen der Hörerzielgruppe und legen damit deren spezifi- 
sche Weltsicht und Alltagsrealität offen (Finke 2019, 18). Ein*e Moderator*in 
stellt dadurch eine emotionale Nähe zu den Radiohörer*innen her (Luginbühl 
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2014, 107). Damit sind Moderator*innen nicht nur Bindeglied zwischen verschie- 
denen Sendeelementen, sondern auch zwischen dem Sender und seinen Hörer*in- 
nen; sie werden damit zu Bezugspersonen für das Publikum (Burger / Luginbühl 
2014). 


Service- / Informationsblöcke gelten als „kundenbindende Services“ und um- 
fassen „alle Sendeinhalte, die dem Hörer helfen oder ihn informieren“ (Media- 
Lexikon Funkhaus Halle). Sie werden zu fest etablierten Servicezeiten gesendet, 
meist zur vollen, mitunter auch zusätzlich zur halben Stunde, und dauern zumeist 
höchstens zwei bis fünf Minuten. In der Regel werden darunter Wettervorhersa- 
gen und Verkehrsmeldungen (oft mit Blitzer-Warnungen) oder Pollenflugprog- 
nosen, Auf- und Untergangszeiten von Sonne und Mond usw. zusammengefasst, 
aber auch Veranstaltungshinweise (ebd.). Gelegentlich zählen Radiosender die 
Nachrichten dazu; vgl. z. B. das ISN-Webradio: „[Unser Serviceblock] ist der 
Teil, den ihr bei uns immer zur vollen Stunde hören könnt. Dort werdet ihr mit 
den aktuellen Nachrichten und dem Wetter versorgt.“ (Internetquelle 2). 


Die Service- / Informationsblöcke sind in jedem Sender standardisiert in Bezug 
auf Länge und Verhältnisse, Abfolge, Verpackungsrahmungen; dadurch soll die 
Wiedererkennbarkeit des Programms gewährleistet werden. Von Radioprakti- 
ker*innen wird immer wieder die Gefahr benannt, dass durch solche ‚„Wortblö- 
cke“ die stimmungsvolle Sendeanmutung, die vor allem durch die Musik erzeugt 
wird, durchbrochen, zerrissen wird. Deshalb übernehmen inzwischen in einigen 
Programmen die Moderator*innen selbst Teile des Serviceblocks, z. B. Wetter 
und Verkehr. 


Die Sendeverpackung oder kurz Verpackung umfasst alle Sendebestandteile, die 
zur On-Air-Promotion, also zur Eigenwerbung eines Senders innerhalb des Pro- 
gramms und zur Strukturierung seiner Inhalte beitragen. Der Begriff der Verpa- 
ckung nimmt Bezug auf das linguistische Prinzip des Framing (Tolson 2006, 51 
mit Verweis auf Goffman 1974), wonach Kommunikationssituationen durch for- 
malisierte Rahmungen kontextualisiert und dadurch strukturiert werden. Verpa- 
ckungselemente aktivieren also mittels gewählter Sprechweisen, durch musikali- 
sche und klangliche Codes spezifische Kontexte, die den Hörer*innen z. B. 
signalisieren, dass nach einem unterhaltenden Teil ein ernster Teil mit den Nach- 
richten folgt. Aber auch die Anmutung eines gesamten Senderkonzepts kann sich 
auf diese Weise rahmend durch alle in einem Sender verwendeten Verpackungs- 
elemente ziehen. 
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Unter dem Begriff Verpackung wird eine große Zahl verschiedener Typen subsu- 
miert, die von Radiopraktiker*innen in Redaktionen und Produktionsabteilungen 
teils relativ einheitlich, teils unterschiedlich bezeichnet werden (Haas et al. 1991, 
463 ff.). Dazu gehören unter anderem die Typen Bumper (führt ein einzelnes Pro- 
grammelement oder eine Rubrik ein), Trailer (kündigt Sendungen, Beiträge oder 
Events anderer Programmslots an), Show Opener (eröffnet eine Sendestunde), 
Musikbett (sendungs- oder rubrikspezifische Instrumentalmusik, über die live 
moderiert wird), Jingle (gesungener Claim / Sendername), Logo (melodisches 
Motiv, das den Sender ähnlich einem visuellen Logo wiederholt repräsentiert), 
Stinger (Outro eines Beitrags oder einer Rubrik), Donut (fertiges Paket aus Bum- 
per, von den Moderator*innen live zu besprechendes Musikbett und Stinger), 
Sounder (elektronisch erzeugter Signalklang) und Transition (musikalische Über- 
leitung zwischen zwei Hit-Titeln) (Föllmer 2018). Eine besondere Stellung besitzt 
der Swoosh, ein glissandierendes Zischen oder Rauschen, das viele Verpackungs- 
elemente ein- oder ausleitet. Durch seinen nicht-tonalen Charakter lässt sich der 
Swoosh ohne Dissonanzwirkung über Ende und Anfang jedes Musiktitels legen 
und eignet sich zum Verbinden von Programmelementen, zum Beispiel als Teil 
von Transitions (ebd.). Zugleich weckt das meist weit aufsteigende Zischen ana- 
log zu großen aufsteigenden Intervallen, und damit im Sinne der exclamatio, Auf- 
merksamkeit für die darauf folgende Information, etwa die Nennung des Sender- 
namens, des Sender-Claims oder des nächsten Musiktitels. 


Neben den genannten strukturierenden, aufmerksamkeitslenkenden Funktionen 
haben Verpackungselemente weitere Aufgaben, etwa die Erwartung der Hö- 
rer*innen auf kommende Sendeinhalte abzustimmen und ein kohärentes Sender- 
Image zu etablieren. 


Der Three Element Break (3EB) gilt in der Literatur als Bestandteil der Mode- 
ration (für einen Überblick vgl. z. B. Finke 2019, 24 ff.). Er dient speziell der 
formattypischen Organisation einer Radiosendung im Sinne einer Dramaturgie. 
Er verbindet unterschiedliche Programmelemente miteinander (Haas et al. 1991), 
überwiegend als Überleitung von einem Musik- zu einem Wortbeitrag oder um- 
gekehrt. Seinen Namen verdankt der Three Element Break dem formelhaft-ritua- 
lisierten Aufbau aus oft drei (bis fünf) Schritten, die klimaktisch angeordnet wer- 
den (vgl. z. B. Eichmann 2012). Häufige Bestandteile sind der Sendername, die 
Uhrzeit, die Hörerbegrüßung oder Moderator*innen-Selbstvorstellung, ein Intro 
oder Outro, Titel und / oder Interpret*in der gerade gespielten oder folgenden Mu- 
sik oder ein Teaser auf ein anderes Programmelement (Haas et al. 1991; Kröm- 
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ker / Klimsa 2005; La Roche / Buchholz 2017). Dabei wird meist eine Pflichtin- 
formation, also die Platzierung bestimmter vom Sender vorgegebener Inhalte (z. 
B. Senderslogan, Stationsansage), verknüpft mit einer Service-Information (z. B. 
Uhrzeit) (Finke 2019, 27). 


Indem 3EBs üblicherweise die Uhrzeit und / oder den Sendeort als eines der drei 
Elemente enthalten, plausibilisieren sie die Kopräsenz der Hörer*innen in einer 
Live-Sendung. Couldry (2003) schreibt solchen Inszenierungen von „Liveness“ 
einen rituellen Charakter zu. Er stellt fest, dass der umfassendste Anspruch der 
Medien die Repräsentation der Realität ist, speziell der sozialen Realität einer Ge- 
sellschaft. Medienrituale basieren für ihn auf diesem Anspruch. Eine zentrale ri- 
tuelle Kategorie dabei ist Liveness: Da die inhaltlich korrekte Repräsentation der 
Realität durch den Sender praktisch nicht überprüfbar ist, liefert der Sender wie- 
derholt Elemente, an denen deutlich wird, dass die Sendung live übertragen wird, 
und das ist an erster Stelle die korrekte Nennung der Zeit. „If so, the decisive 
criterion of liveness is not the factuality of what is transmitted, but the fact of live 
transmission itself.” (ebd., 96). Die Ideenkette der Kategorie Liveness lässt sich 
demnach so darstellen: 


„1) that we get access through liveness to something of broader significance, worth 
getting access to now, not later; 2) that the ‚we’ who gain live access is not random, 
but a representative social group; 3) that the [this] media (not some other social 
mechanism) is the priviledged means for obtaining that access.” (ebd., 98 £.). 


Demnach markiert ein 3EB den folgenden Song, Beitrag etc. als aktuell, von grö- 
Berer Bedeutung, „worth getting access now“ innerhalb einer spezifischen sozia- 
len Gruppe und durch das dafür geeignetste Medium: den gerade gehörten Sender. 


In praxisorientierten medienrhetorischen Publikationen finden sich Anweisungen 
und Tipps zur Gestaltung von 3EBs (vgl. z. B. Krömker / Klimsa 2005; Lüthje 
2009; Eichmann 2012; La Roche / Buchholz 2017). Die knappe, formelhaft-ritu- 
alisierte Struktur und der klimaktische Aufbau sollen Sicherheit bei der Suche, 
Auswahl, Strukturierung und Präsentation der Inhalte vermitteln und vor sinn- 
und inhaltslosen Bemerkungen bewahren (Haas et al. 1991). In diesen Ratschlä- 
gen wird sowohl der Bezug zu den Redeverfertigungsstadien der Rhetorik deut- 
lich als auch der zu den elocutionären Maximen Perspicuitas und Brevitas: 


„Weniger ist mehr. Ehe Sie mit dem Hörer reden, überlegen Sie, ob Sie ihm auch 
wirklich etwas zu sagen haben. [...] Alles Überflüssige weglassen, das spart Zeit 
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und erhält die Aufmerksamkeit der Hörer für das Wesentliche.“ (La Roche / Buch- 
holz 2013, 55). 


Es wird aber auch empfohlen, in den 3EBs nicht immer die gleiche formelhaft- 
ritualisierte Abfolge zu verwenden, sondern mit Variationen und akustischen oder 
inhaltlich-verbalen Ear-Catchern die Aufmerksamkeit der Hörer*innen zu erre- 
gen (Internetquelle 1). 


Der dreischrittige, mitunter auch fünfschrittige Aufbau von Argumentationen und 
Kurzreden ist nicht nur beim Three Element Break ein verbreitetes rhetorisches 
Muster. Kurze, prägnante Dreierformeln mit einer Spannungssteigerung gelten in 
der praktischen Rhetorik generell als dynamisch, eindringlich und wirkungsvoll 
(vgl. z. B. Geißner 1968 und 1986). Durch ihre Knappheit und Musterhaftigkeit 
sind sie gut sprechbar und für Hörer*innen leicht verständlich. Rhetorische Rat- 
geber (z. B. Geißner 1968, Wachtel 2020) empfehlen drei kurze Äußerungen mit 
je einer Kerninformation, mit denen zunächst an den bisherigen Kontext ange- 
knüpft und dann die eigene Meinung begründet wird, bevor klimaktisch der ei- 
gentliche Zweck- bzw. Zielsatz formuliert wird. Oft wird der mittlere Begrün- 
dungsteil ausführlicher, in drei Denkschritten, abgehandelt, so dass ein Fünfschritt 
entsteht. 


3 Analysematerial und -methode 


Die Beispiele hybrider Radioprodukte, die in diesem Beitrag analysiert werden, 
stammen aus Morgensendungen verschiedener Länder. Sie sind Bestandteil des 
Forschungsprojekts „Transnational Radio Encounters TRE“ (Föllmer / Badenoch 
2018). Dieses Projekt verfolgte das Ziel, Programme formal ähnlichen Zuschnitts 
aus möglichst unterschiedlichen geografischen Regionen auf Ähnlichkeiten und 
Unterschiede in ihrer Machart zu vergleichen. Es wurde ein umfangreiches Radi- 
okorpus formal ähnlicher Sendungen erstellt, um analytisch erkennbare Differen- 
zen möglichst weitgehend auf allgemeine kulturelle Unterschiede zurückführen 
zu können und damit möglichst wenig auf solche Unterschiede, die sich aus Bin- 
nendifferenzierungen des Medienmarktes (Popp 2008) ergeben. Zu diesem 
Zweck wurde das Radioformat Contemporary Hit Radio (CHR) gewählt, da es in 
Westeuropa und auch weltweit sehr verbreitet ist, regional in der Regel in mehre- 
ren Varianten vorkommt und sehr hohe Hörerzahlen aufweist (Kropp / Morgan 
2008). Um bei der Analyse Sprachverständlichkeit zu gewährleisten und zugleich 
eine möglichst weite geografische Verteilung zu erreichen, wurden Länder mit 
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den Amtssprachen Englisch (Großbritannien, Irland, Australien), Französisch 
(Marokko, Elfenbeinküste, Frankreich), Spanisch (Mexiko, Kolumbien, Ecuador, 
Spanien) und Deutsch (BRD, Österreich, Schweiz) ausgewählt. 


Durch die Wahl eines speziellen Datums sollte erreicht werden, dass zumindest 
zeitweise gleiche oder ähnliche Inhalte in den Programmen thematisiert werden. 
Die Wahl fiel auf den 13. Juni 2014, weil mit dem Datum zwei dominante, welt- 
weit relevante Themen verbunden waren und somit damit gerechnet werden 
konnte, dass diese in der einen oder anderen Weise in den Programmen aufgegrif- 
fen wurden. Dies waren der Beginn der Fußballweltmeisterschaft 2014, die am 
Tag zuvor gestartet war, und der „Pechtag“ Freitag der Dreizehnte. Mitgeschnit- 
ten wurden jeweils zwei Stunden der Kernzeit der Morgensendungen der ausge- 
wählten Programme. Zusätzlich wurden die Senderselbstauskünfte im Internet ge- 
sichtet. 


Als methodische Grundlage der Sequenzanalyse diente der Ansatz von Äberg 
(1999), der technisch und strukturell erweitert und verfeinert wurde. Bei der Se- 
quenzanalyse wurde ermittelt, welche Arten von Sendeelementen in welcher 
Länge, Position und Kombination vorkommen. Dazu wurden zuerst die acht Sen- 
deelement-Typen Moderation, Music (Hit-Titel), Bed (Hintergrundmusik, im Ra- 
dio-Jargon „Musikbett“), Packaging (Verpackung), News (Nachrichten), Service, 
Advertisement (Werbung) und Piece (Beitrag) unterschieden und separat unterei- 
nander als Spuren in der DAW angelegt. Innerhalb dieser Typen wurden dann 
Kategorien konkreter einzelner Sendeelemente ermittelt, darunter auch Three Ele- 
ment Breaks. 


4 Beispielanalysen 


Im Folgenden werden exemplarisch drei Beispiele von Three Element Breaks und 
ein Beispiel eines Service- / Informationsblocks im Hinblick aufihre multimodale 
Rhetorizität analysiert. Die Transkription orientiert sich an GAT2 (Selting et al. 
2009). Die Audios zu den Beispielen sind verfügbar über den QR-Code zu Beginn 
des Artikels bzw. unter: https://cloud.uni-halle.de/s/5pKjUSsflpbg4yW. 
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4.1 „Radio la Bruja” aus Ecuador (Three Element Break) 


Das erste Beispiel stammt vom privaten ecuadorianischen Jugendsender „Radio 
la Bruja“. Das Musikformat umfasste zum Aufnahmezeitpunkt die Top 40, Latino 
Pop und Modern Rock. 


01 MUSIK ((instrumental: Musikbett 


02 MOD I| <<all,ruf> amigos y aMIgas; de JOta ce Radio 
La BRUjla; | ] 
[Musikakzent f}] 
II| buenos DÍ[a::s; | ] 


[MusikakzentfJ ] 
III| estamos VIENdo un fanTÄStico dia VIERnes; 
TREce de JUnio; dos mil ca!TOR!ce:.||> 
Musikakzent? 
instrumental: Musikbett)) 


Transkript 1: „Radio la Bruja” aus Ecuador (Audio 1) 


Der Ausschnitt beginnt mit einem lauten, rhythmisch-dynamischen Musikbett (Z. 
01). Es wird schlagartig nahezu auf Null geregelt („gefadet“), als die Moderatorin 
anfängt zu sprechen (Z. 02), läuft aber anfangs fast unhörbar und später sehr leise 
bis zum Ende weiter. Gelegentlich wird die Lautstärke des Musikbettes plötzlich 
zum „Musikakzent“ aufgedreht (Z. 03, 05, 08). Diese Praxis des sogenannten Fa- 
der Riding, hier in extremer Ausprägung ausgeführt, war unter anderem bei US- 
amerikanischen Radiomoderatoren in den 1970er Jahren verbreitet. Wird sie ma- 
nuell ausgeführt, kann sie nur im Selbstfahrermodus von den Moderator*innen 
ausgeübt werden, weil die Regelbewegungen eng in Sprechpausen eingepasst sind 
und nur die Moderator*innen selbst wissen, wann sie Sprechpausen setzen. Dem 
Höreindruck nach liegt hier mit hoher Sicherheit die manuelle Ausführung vor. 
Das Fader Riding kann allerdings auch automatisiert durch sogenanntes Gating 
ausgeführt werden. Bei diesem Verfahren blendet ein Regelverstärker die Musik 
ab, sobald ein Mikrofonsignal eines bestimmten Mindestpegels anliegt. Beide 
Verfahren sind sowohl im europäischen als auch im US-amerikanischen Radio 
heute nicht mehr gebräuchlich und wirken aus einer heutigen westeuropäisch ak- 
kulturierten Perspektive anachronistisch. 

Die Moderatorin befindet sich allein im Studio. Sie spricht freundlich, mit zahl- 
reichen starken Akzenten, mittellaut bis laut mit einer Tendenz zum Rufen, 
schnell und artikuliert präzise, zum Teil mit Lautdehnungen und Lautheitssteige- 
rungen am Ende der Äußerungen. Der klassisch knappe Break besteht aus drei 
inhaltlichen Schritten: 
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1. Die Moderation redet die Hörer*innen als Freunde und Freundinnen von 
Radio la Bruja an: amigos y aMIgas; de JOta ce Radio La BRUj[a;| (Z. 
02), 

2. wünscht ihnen einen guten Tag: buenos Dla.:s;| (Z. 04) 

3. und stellt in der Wir-Form fest, dass man einem fantastischen Freitag, dem 
13. Juni 2014, entgegen sehe: estamos VIENdo un fanTÄStico dia VIERnes; 
TREce de JUnio; dos mil ca!TOR!ce:.|| (Z. 06-07). 


Das Ende jedes Schrittes wird jeweils durch einen kurzen Musikakzent verdeut- 
licht. Dadurch wird der dreischrittige Aufbau des 3EB verdeutlicht und die Span- 
nung steigert sich jeweils: Die ersten beiden Musikakzente (Z. 03 und 05) begin- 
nen überlappend, also bereits kurz vor dem Ende der gesprochenen Äußerung, 
und werden durch rasches und kurzes Anheben und Absenken der Lautstärke er- 
zeugt. Der letzte Musikakzent (Z. 08) beginnt erst, nachdem die gesprochene Äu- 
Berung inhaltlich und prosodisch abgeschlossen ist, hier wird die Lautstärke des 
Musikbettes rasch angehoben, aber nicht wieder abgesenkt. Dadurch wirkt dieser 
Musikakzent stärker als die beiden ersten, durch ihn wird ein abschließender 
Spannungshöhepunkt erzeugt. 


In diesem Beispiel werden also gesprochene Moderationsäußerungen verwoben 
mit musikalischen Akzenten, die die Struktur des Gesagten verdeutlichen und 
die Spannung bis zum Ende steigern. Moderation und Musik sind aber wenig 
aufeinander abgestimmt. Die Sprechpassagen sind rhythmisch nicht so in den 
musikalischen Verlauf eingepasst, wie dies bei der Verwendung von Verpa- 
ckungselementen üblicherweise der Fall ist. Der Einstieg der Moderation erfolgt 
beispielsweise nicht zum Beginn des Taktes des Musikbetts, sondern wirkt be- 
liebig. Das gleiche gilt für den Abschluss, der mitten in (und eben nicht rhyth- 
misch passend unmittelbar vor) einem klimaktischen Bläsereinsatz der Musik 
erfolgt. 


4.2 „Live Radio” aus Österreich (Five-Element-Break) 


Das zweite Beispiel stammt vom größten privaten Regionalsender in Oberöster- 
reich „Live Radio“. Als Musikformat wurde zum Aufnahmezeitpunkt Fresh AC 
(Pop- und Rockmusik seit 1985) angegeben. 
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01 MUSIK ((Musiktitel „Seven seconds“) 

02 MOD I| <<all,mf,© > sechs uhr zweiundVIERzig- | 

03 II| GUten morgen Oberösterrei:ch. || 

04 III| und DA> <<f,rit> WAR er, |>) 

05 SOUNDER T ((BEEP BEEP)) 

06 MOD unser BRÜCKenpicknickbaSA:R. || 

07 BUMPER ((..)) Das LIVE radio BRÜCKenpicknick. || 

08 MOD + ( (Musikbett) am(.)NEUNzehnten juni sperren wir die 
Musikbett HALbe nibeLUNgenbrücke, | 

09 LEgen RAsen aus und WARten auf EINTAUsendFÜNFhundert 

LIVE radio Hörer, | 
10 mit denen wir geMEINsam PICKnicken werden, |) Ka) 


Transkript 2: „Live Radio“ aus Österreich (Audio 2) 


Die Moderatorin befindet sich allein im Studio und beginnt diesen Break (Z. 02), 
während noch der Musiktitel „Seven Seconds“ läuft. Die Musik wird (wahr- 
scheinlich über eine Gate-Schaltung durch automatisiertes Fader Riding, siehe 
Beispiel 1) leiser geregelt, während gesprochen wird, läuft aber über den ersten 
Einspieler (Sounder in Z. 05) bis zum Bumper in Zeile 07 als leises Musikbett 
durch. Der Sounder (Z. 05), ein zweifaches „BEEP“, erinnert an eine Hupe aus 
alten Slapstick-Filmen und wird gefolgt von lebendigem Vogelgezwitscher. Die 
beiden Elemente wecken auf freundlich-humorvolle Art die Aufmerksamkeit. Der 
Break besteht aus fünf Schritten und ist stärker noch als das erste Beispiel als 
Hybrid aus Sprach- und Klangelementen gestaltet. Die Moderatorin spricht den 
Five Element Break durchweg freundlich-sachlich, mittellaut, mittelschnell, mit 
mittelpräziser Artikulation: 


1. Sie sagt zunächst die Uhrzeit an: sechs uhr zweiundVIERzig-| (Z. 02), 

2. begrüßt dann das Sendegebiet: GUten morgen Oberösterrei:ch.|| (Z. 03) 

3. und bezieht sich auf ein Klangereignis, das allerdings noch gar nicht zu 
hören war: und DA WAR er,| (Z. 04). 

4. Dann erst folgt das Klangereignis, nämlich der vorproduzierte Sounder: 
BEEP BEEP (Z. 05). 

5. Dieser Sounder wird abschließend von der Moderatorin als akustische Ken- 
nung identifiziert: unser BRÜCKenpicknickbaSA:R.|| (Z. 06). 


Es folgt ein vorproduzierter Bumper (Z. 07), der noch einmal auf das Live Radio- 
Brückenpicknick hinweist. Der Bumper wird durch einen Swoosh eingeleitet, der 
die gleichzeitig erfolgende Ausblende des noch darunter liegenden Musiktitels 
verdeckt. Damit schafft er Raum und leitet zugleich hin auf den folgenden Uni- 
sono-Schlag mehrerer Band-Instrumente (vermutlich Snare Drum, E-Gitarre und 


© Frank & Timme Verlag für wissenschaftliche Literatur 29 


E-Bass). Die vorproduzierte Äußerung des Promo-Sprechers „Das LIVE radio 
BRÜCKenpicknick“ (Z. 07) klingt aufgrund eines Filters andeutungsweise nach 
Telefonübertragung und vermittelt dadurch den Eindruck von Aktualität und 
Dringlichkeit. Exakt mit Äußerungsende (Z. 08) setzen durchgehende 32stel- 
Schläge auf der Hi Hat ein, was abgeschwächt an einen Snare-Wirbel erinnert, 
wie er zum Beispiel im Zirkus zur Steigerung der Spannung vor besonders ge- 
fährlichen artistischen Darbietungen erklingt. Der Ankündigung des Events durch 
die Moderatorin (Z. 08 ff.), schneller, gespannter und lauter gesprochen auf mit- 
tellautem, dynamisch-rhythmischem Musikbett, verleiht dies die Aura eines be- 
sonders bedeutungsvollen Moments. 


Insgesamt erzeugt die Passage den Eindruck von Intensität und aktueller Bedeut- 
samkeit. Die Moderation trägt hierzu die verbalen Inhalte bei und setzt besonders 
gegen Ende sprecherisch Spannungsakzente. Die herausgehobene Markierung mit 
den Attributen Intensität und Bedeutsamkeit erfolgt aber vorwiegend durch die 
schnelle Abfolge, die produktionsbedingt hohe klangliche Prägnanz und das prä- 
zise Timing der verwendeten Verpackungselemente im Zusammenspiel mit den 
gesprochenen Moderationsäußerungen. Im Gegensatz zum Beispiel des ecuado- 
rianischen Senders La Bruja (Beispiel 1) wird hier eine Vielfalt unterschiedlicher 
Verpackungselemente verwendet. Die Elemente sind hochwertig produziert und 
werden so eingespielt, dass Melodieverläufe, Rhythmen und Akzente von Mode- 
ration und Verpackungselementen sich wie im musikalischen Zusammenspiel ei- 
nes Duos gegenseitig ergänzen. 


4.3 „Fun Radio“ aus Frankreich (Three und Five Element Break) 


Das dritte Beispiel „Fun Radio“ stammt aus einem französischen Radionetzwerk 
verschiedener FM Radiostationen (RTL Gruppe). Als Musikformat wurde zum 
Aufnahmezeitpunkt R&B, Tanz-, Elektro- und House Musik angegeben. 


Im Studio befinden sich vier Moderator*innen (drei Männer und eine Frau) und 
erzeugen eine quirlige gesellige Atmosphäre von hoher akustischer Intensität. 
Starmoderator der Morgensendung ist Bruno. Auf ihn beziehen sich viele vorpro- 
duzierte Soundeffekte. Offensichtlich war er einige Zeit abwesend und kehrt heute 
in die Sendung zurück, was durch vorproduzierte Äußerungen verschiedener 
Sprecher*innen mit Soundeffekten (im Transkript mit VP gekennzeichnet) ge- 
bührend hervorgehoben wird. 
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MOD AUDREY eh JEAN-paul ROUVE, | Eric eh juDOR et-| 


Audrey laMILLE;| comPLETent eh le casTING ah; || 


<<all,f, ruf> il est euh SEPT heures trente-deux; | 
un TRÈS beau reVEIL; | 

une BONNE matiNEE sur FUN, | 

avec tout de SUITE le reTOUR de BRUno dans la raDIO; | 


et à tout à 1’HEURE.||> 


SOUNDER ( (SWOOSH) ) 


OPENER ( (WECKERKLINGELN) 
<<f, ruf> wa:: wake !UP! BRU:::}NO:::; |> 
VP? c'est bruNO DANS la raDIo. | 


vPs1 <<amerikanisch> BRUno. || > 


VPs2 SIX heures NEUF heu:res SUR FUN radio. || 
vps1l LISten DANCE floor. || 


MOD BRUNO I| <<all,f> SEPT heures trente-QUATre 
II| c'est FUN radio; | 
BON reVEIL; | 
je m'appelle bruno; | 


BONNE FÊTE aujourd’hui; à tout-|> 


Transkript 3: „Fun Radio“ aus Frankreich (Audio 3) 


Vor dem hier präsentierten Ausschnitt wurden Nachrichten aus der Musikszene 
gesendet, gesprochen von der Moderatorin Audrey. Nun schließen sich drei fünf- 
schrittige Breaks in Folge an, die aufwändig gestaltet sind. Zu hören sind zwei der 
vier Moderator*innen, Audrey (Z. 01-07) und Bruno (Z. 14-18). Darüber hinaus 
wird mehrfach die vorproduzierte akustische Programmkennung eingespielt, in 
Variationen und insgesamt von drei Stimmen gesprochen (einer weiblichen, zwei 
männlichen; Z. 10-13). Außerdem werden vorproduzierte Soundeffekte einge- 
setzt: der Trenner (Swoosh in Z. 08), der Show Opener (Weckerklingeln in Z. 09) 
und die vorproduzierte zweisprachige Programmkennung (französisch und eng- 
lisch, Z. 11 und 13) auf einem prominenten, lauten Musikbett (Z. 10-13). 


Unter der gesamten Passage liegt ein Musikbett, das im Stil eines Techno-Tracks 
einen einzelnen Ton in Achteln wiederholt, gelegentlich in die Oktave springt 
oder für einen Schlag einen Ganzton absinkt. Die schnell wiederholten elektroni- 
schen Achtel ähneln dem Sound von Morse-Tönen. Mit ca. 130 bpm ist das Met- 
rum „eilig“. Mit der Tonart h-Moll wird eine gewisse Dramatik signalisiert. 
Dadurch erhält die Musik das typische Gepräge von News-Intros oder -Betten. 
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Der erste Break (Z. 03-07) beginnt nach den Musiknachrichten ohne akustischen 
Trenner, aber mit verändertem Sprechstil: Hatte die Moderatorin Audrey die Mu- 
siknachrichten mittellaut und mittelschnell präsentiert, wird sie mit Beginn des 
Breaks plötzlich deutlich schneller und lauter (mit einer Tendenz zum Rufen) und 
spricht mit größerer Sprechspannung. Dieser Break besteht aus fünf Schritten: 


1. Die Moderatorin sagt die Uhrzeit an: il est euh SEPT heures trente-deux; | 
(Z. 03), 

2. wünscht den Hörer*innen ein sehr schönes Aufwachen: un TRES beau re- 
VEIL;| (Z. 04) 

3. und einen guten Vormittag auf dem Sender: une BONNE matiNEE sur 
FUN,| (Z. 05), 

4. kündigt Brunos Rückkehr in Kürze an: avec tout de SUITE le reTOUR de 
BRUno dans la raDIO;| (Z. 06) 

5. und verabschiedet sich bis gleich: et à tout à L’ HEURE. || (Z. 07). 


Als Überleitung zum nächsten Break fungiert ein Sounder (Z. 08), und zwar ein 
Swoosh, der eher ungewöhnlich nicht auf einem breitbandigen Rauschsignal be- 
ruht, sondern als aufsteigender Sinus-Sweep ausgeführt ist, d. h. als Glissando 
eines Einzeltons. Dieser setzt exakt mit Audreys Wortende ein und mündet in eine 
abschwächend verrauschte, aber noch als solche erkennbare Explosion. Indem die 
Lautstärke des Musikbetts und der hinzugefügten Elemente stark an- und in den 
Vordergrund gehoben werden, ergibt sich eine deutliche Intensitätssteigerung. 
Durch kurzes Ausbleiben des Musikbetts nach der Explosion wird hier eine Seg- 
mentgrenze kenntlich gemacht. Das direkt darauf folgende Weckerklingeln ist 
dem nächsten Break zuzuordnen. 


Der zweite Break ist ebenfalls fünfschrittig. Er besteht komplett aus vorprodu- 
zierten gesprochenen und klanglichen Elementen, zum Teil auf Französisch, zum 
Teil auf Englisch: 


1. Der Break beginnt mit einem Show Opener, eingeleitet durch ein Wecker- 
klingeln, überlappend dazu der langgezogene Weckruf wa: wake !UP! 
BRUU:::NOOO:::;| (Z. 09), von einer männlichen Stimme scheinbar aus der 
Ferne gerufen (als solches kenntlich gemacht durch eine ausgeprägte Hall- 
fahne am Signalende). Nach wake !UP! setzt ein erster Schlagzeug-Fill In 
(Überbrückung der Pausen melodischer Phrasen) ein und wird unter dem 
o. g. Ruf nach Bruno durch einen zweiten Fill In, einen Tomtom-Wirbel, in- 
tensiviert fortgesetzt. Das gerufene BRUU:::NOOO::: intoniert absteigend 
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die Töne E und D und manifestiert damit den Dominantseptakkord Fis7 der 
zuvor eingeführten Tonika h-Moll. Damit ist musikalisch der Moment größ- 
ter Spannung erreicht. 


. Auf den Weckruf folgt die akustische Sendungskennung: c'est bruNO 


DANS la raDIO.| (Z. 10), gesprochen von einer hohen und hauchigen weib- 
lichen Stimme. Diese wird unterlegt vom dritten Schlagzeug-Fill, der selbst 
aus drei tonal absteigenden Akzenten (hohe, mittlere und tiefe Toms) be- 
steht und durch einen auf den Schlagzeug-Sound gelegten Phasing-Effekt 
besonders intensiviert wird. 


. Der Name des Starmoderators wird in diesem Moment höchster Intensität 


noch einmal von einer sehr tiefen männlichen Stimme mit amerikanischem 
Akzent wiederholt: BRUno.|| (Z. 11). Eng gefolgt erscheint das hohe Jauch- 
zen einer Männerstimme, die auf dem stark erhöhten Intensitätslevel rhyth- 
misch mit dem Drop des Musikbetts zusammenfällt, also dem Wiedereinsatz 
des nun energetischeren, üppiger instrumentierten Musikbetts, das in eben 
diesem Moment eine kleine Terz absteigend zur Tonika h-Moll zurückkehrt. 


. Dann nennt eine jugendlich-hohe und helle männliche Stimme Uhrzeit und 


Sendername: SIX heures NEUF heu:res SUR FUN radio.|| (Z. 12). Darun- 
ter schwillt kurz das Johlen einer großen Menschenmenge an. 


. Es folgt das Sendungsmotto L/Sten DANCE floor.|| (Z. 13), gesprochen von 


der tiefen männlichen Stimme mit amerikanischem Akzent, die bereits in 
Zeile 11 zu hören war. Die Musik setzt in diesem Moment wieder kurz aus 
und macht Platz für die Stimme der Hauptperson, den Starmoderator Bruno. 


Der dritte Break wird komplett vom Starmoderator Bruno präsentiert. Der Break 
besteht aus fünf Informationen, die nur schwach prosodisch voneinander abge- 
setzt sind und insgesamt einen einzigen Spannungsbogen bilden, mit einer Klimax 
am Ende. Das Musikbett darunter ist wieder nur sehr leise pulsierend wahrzuneh- 
men. Es liegt weiterhin in der Haupttonart h-Moll und vermittelt dadurch den Ein- 
druck von Verlässlichkeit, Stetigkeit, einer sicheren Basis. Bruno setzt auf diesem 
Fundament lässig ein. Dabei spricht er aber extrem schnell. 


u a 


Bruno sagt die Uhrzeit an: SEPT heures trente-OUATre (Z. 14) 
und nennt die Senderkennung: c'est FUN radio;| (Z. 15), 
wünscht ein gutes Aufwachen: BON reVEIL;| (Z. 16), 

stellt sich vor: je m'appelle bruNO;| (Z. 17) 

und wünscht abschließend allen eine schöne Feier: BONNE FETE 
aujourd'hui; à tout-| (Z. 18). 
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4.4 Die SWR1 Halbarie (Service- / Informationsblock) 


Die unter Mitarbeiter*innen sogenannte Halbarie im Morgenprogramm des Süd- 
westdeutschen Rundfunks (SWRI) ist ein Beispiel für eine zeitlich deutlich länger 
ausgedehnte Konstruktion aus Sprechpassagen und Verpackungselementen (Bei- 
spiel 4). Mit „Halbarie“ ist der relativ lange Service- / Informationsblock zur hal- 
ben Stunde gemeint, der überwiegend mit Musik unterlegt ist und aus mehreren 
unterschiedlichen, aufeinander abgestimmten Teilen besteht. Er erfordert von den 
Moderator*innen besondere Konzentration, da sie nicht nur moderieren, sondern 
auch alle anderen Bestandteile des Blocks passgenau steuern müssen, so dass eine 
pointierte Performance entsteht. Die aufwändig gestaltete Verpackung wird aus 
drei aufeinanderfolgenden Donuts mit angehängtem kurzem Show Opener gebil- 
det. Donuts bestehen aus einem Logo oder Bumper als markantem Einstiegsele- 
ment, einem darauffolgenden, stilistisch angepassten Musikbett zum Darüber- 
sprechen von Inhalten (hier über dem ersten Musikbett Verkehr / Service, über 
dem zweiten Nachrichten und über dem dritten Wetter) und einem weiteren Logo 
oder Stinger als Abschluss, der hier durch die dreifache Aneinanderreihung zwei- 
mal mit dem nächsten Logo zusammenfällt bzw. mit ihm identisch ist. 


Im Transkript sind die Wortanteile (Nachrichten, Moderation, Wettervorhersage) 
verkürzt wiedergegeben, da es in der Analyse vor allem auf die Übergänge zu den 
Klangelementen ankommt. Im Studio befindet sich der Morgenmoderator 
(Thomas Schmitt). Der ca. fünfminütige Ausschnitt setzt 06.31 Uhr ein, mit einem 
Sounder, der die Verkehrsmeldungen ankündigt („Verkehrs-Beep“; Z. 01). 


SOUNDER ((verkehrs-BEEP) ) 
MODERATOR SECHS uhr EINunddreifig; | 


LOGO f#"-g"-a"-d"" (110bpm) 


MODERATOR Swr EINS BAdenwWÜRTtemberg ist HIER -| 
mit dem aktuELLsten verKEHRSservice im land, | 
eine geFAHrenmeldung haben wir hier von der A5 
ihnen unterwegs GUte und SICHere FAHRT. || 


LOGO a"-bb"-c"-f" (130bpm) 


MODERATOR DER NACHrichtenüberblick mit PEtra RETner. || 
NR-Spre.in guten MORgen. | | 
der vor zwei jahren in SYrien verschleppte us-journa- 
list peter CURtis ist wieder FREI; | 
CEN) 
die NÄCHSten NACHrichten in swr EINS; | 
um SIEben uhr. | | 


C#"-4”"-e""-a” (135bpm) 
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MODERATOR ANdreas MaraLITza ist im swr eins WETterstudio; | 
ich hab GRAde schon ( (...)) 

WETTER-MOD. ((..)) das wetter bleibt INSgesamt doch ZIEMlich 
durchwACHsen. | | 

MODERATOR DANke andREas; | | 


SHOW OPENER [h"-a"-f#".d"-e"-d" (115bpm) 


STAT.VOICE SWR EINS Guten MORGen Baden Württemberg. || 
<<gesungen> Guten MORGge:n> 
mit THOmas SCHMITT. || 
((instrumental: Musiktitel)) 


Transkript 4: Morgensendung des SWR1 Baden-Württemberg (Audio 4) 


Der Moderator sagt die Uhrzeit an (Z. 02) und es folgt das erste Logo (Z. 03). 
Dann nennt der Moderator den Sendernamen (Z. 04) und kündigt den Verkehrs- 
service an (Z. 05), den er dann auch selbst spricht (Z. 06). Er schließt mit einem 
Wunsch ab: GUte und SICHere FAHRT.|| (Z. 07). Dann folgt das zweite Logo 
(Z. 08). Danach leitet der Moderator zu den Nachrichten über und nennt den Na- 
men der Nachrichtensprecherin (Z. 09). Nachdem sie die Nachrichten präsentiert 
und auf die nächsten Nachrichten 07.00 Uhr verwiesen hat (Z. 10-14), folgt das 
dritte Logo (Z. 15). Der Moderator leitet nun zu den Wettermeldungen über, in- 
dem er den Namen des Wettermoderators nennt und offensichtlich von einer ei- 
genen Wettererfahrung vom Morgen berichtet (Z. 16). Nachdem der Wettermo- 
derator die Wettervorhersage präsentiert hat (Z. 17), bedankt sich der Moderator 
der Morgensendung. Durch die Anrede mit dem Vornamen stellt er seine Ver- 
trautheit mit dem Kollegen heraus: DANke andREas;|| ( (Z. 18). Nun erklingt ein 
Show Opener (Z. 19), gefolgt von der Station Voice (Z. 20-22), und schließlich 
beginnt der nächste Musiktitel. 


t 2 $ 3 7 4 
Musikbett Musikbett Musikbett 


Abb. 1: Verlaufsstruktur von Beispiel 4 


- 
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Fe SER Fass 


f#"-g"-a"-d" a"-b b"-e™"-f" c#"-d"-e"'-a™" 
(D-Dur) (F-Dur) (A-Dur) 
aufsteigend aufsteigend 


aufsteigend 


Abb. 2: Musikalische Struktur der drei Logos 


Die Konstruktion zeichnet sich durch mehrere Merkmale als klimaktische Struk- 
tur aus. Die drei Logos (in den Abbildungen Nummer 1-3) wiederholen das glei- 
che melodische Motiv in sequenzierender Form, d. h. sie beginnen jeweils auf 
einem höheren Ton als das vorherige. Der abschließende Show Opener dagegen 
(Nummer 4 in Abb. 1) verwendet ein anderes Motiv mit größerer zeitlicher Aus- 
dehnung. Mit jedem Logo nimmt das Tempo zu, beginnend mit 110 bpm, dann 
130 bpm und beim dritten 135 bpm, was bereits recht „eilig“ wirkt. Parallel stei- 
gen die Dynamik und die empfundene Lautheit vom ersten zum zweiten Logo 
deutlich an, sinken zum dritten geringfügig ab und erreichen beim Show Opener 
ihr Maximum. Die Instrumentation der Logos beruht auf synthetischen Sounds, 
die an Piano, Streicher und Bläser erinnern, was tendenziell verhalten wirkt, durch 
eine recht hohe Lage aber eine gewisse Intensität erhält. Beim zweiten Logo wer- 
den zudem tiefe Trommeln eingesetzt, die sich in Radio- und TV-Trailern generell 
als typisches Ankündigungselement von Nachrichten etabliert haben (Föllmer 
2018). Melodisch wird ein gebrochener, im Anstieg sich beschleunigender Sex- 
taufschwung eingesetzt (vier Töne in der aufsteigenden Folge Halbtonschritt- 
Ganztonschritt-Quart). Sextaufschwünge gelten als sehnsuchtsvoll (siehe Ab- 
schnitt 1), wobei die gebrochene Form die verwendete kleine Sext nur bedingt 
exponiert und daneben den abschließenden Quartaufschwung betont, der eine aus- 
geprägte Schlusswirkung, einen Eindruck des „Angekommenseins“ vermittelt. 
Das kann hier so interpretiert werden, dass jedes Logo eine neue Rubrik einführt 
und jeweils signalisiert: Nun sind wir bei einem neuen Thema angekommen. 


Das Motiv durchläuft in den Logos die drei Tonarten D-Dur, F-Dur und A-Dur, 
bevor der abschließende Show Opener das D-Dur wieder aufgreift und damit den 
Zirkel schließt. Das A-Dur des letzten Logos bildet mit dem abschließenden D- 
Dur des Show Opener eine schließende Kadenzwendung, in der A-Dur die Domi- 
nante und D-Dur die Tonika darstellt. Im Verhältnis zu dieser eindeutigen 
Schlusswirkung vermitteln die harmonischen Verhältnisse der beiden davorlie- 
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genden Logos Offenheit oder Ungewissheit. Funktionsharmonisch sind die Be- 
wegungen von D-Dur nach F-Dur und A-Dur nur vage als Sequenzierung zu be- 
stimmen. In der Tradition der deutschen Schlagermusik werden Sequenzierungen 
zur Spannungssteigerung oder -erhaltung eingesetzt, quasi um einem mittlerweile 
„verbrauchten“ Material noch einmal Energie zu verleihen. 


Show Opener (4) 


Bahn 


h""-a"-£#'"-d'"-e""-d"" 
(D-Dur) 
absteigend 
115 bpm 


Abb. 3: Musikalische Struktur des abschließenden Show Openers 


Der abschließende Show Opener weist zwar verwandte instrumentatorische Ele- 
mente auf (Bläser, Streicher, Drums), unterscheidet sich aber deutlich, indem er 
mit einem chorisch von Frauenstimmen gesungenen Motiv einsteigt. Im Gegen- 
satz zu den Logo-Motiven ist dieses nun absteigend angelegt. Die Tonfolge h"'- 
a"'-f#'"-d"'-e"'-d'" (mit der Tonschrittfolge Ganzton-kleine Terz-große Terz-gan- 
zer Wechselton hoch und wieder runter) ist zum Grundton d der dominierenden 
Tonart D-Dur orientiert. Mit der Verlangsamung von davor 135 auf 115 bpm 
kommt das musikalische Geschehen zur Ruhe. Mit der anschließenden Überlei- 
tung in den ersten Musiktitel nach diesem Service- und Nachrichtenblock kommt 
der bis dahin mehrere Minuten währende Break (ununterbrochene Aufeinander- 
folge aufeinander abgestimmter Logos, Musikbetten und Show Opener) zum 
Ende und übergibt an die Musik. Die klimaktische Struktur der ersten drei Ele- 
mente kulminiert also im letzten, das wiederum in einen Popsong mündet. 


Die Struktur der Verpackung steht damit im Kontrast zur häufig angenommenen 
höheren Wichtigkeit von Informationen im Radio gegenüber der Musik. Die 
Sprechhaltung von Sprecher*innen und Moderator*innen des Nachrichten- und 
Serviceblocks vermittelt in der Regel eine gewisse Dringlichkeit und Gewichtig- 
keit, die auch als Behauptung eines Primats dieser Inhalte interpretiert werden 
kann. Der primär durch musikalische Mittel getragene klimaktische Aufbau der 
Verpackungselemente steht dem diametral entgegen. Auf fast schon subversive 
Art orientieren die vier Elemente die Aufmerksamkeit auf die dem Nachrichten- 
und Serviceblock folgende Musik. 
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5 Fazit 


Die exemplarische Analyse der vier Beispiele für Three Element Breaks bzw. Ser- 
vice- / Informationsblöcke macht deutlich, dass ihr Gesamtcharakter erst durch 
das intensiv aufeinander abgestimmte Zusammenspiel unterschiedlicher Ele- 
mente zustande kommt. Musikalische Strukturen und klangliche Bestandteile von 
Verpackungselementen erweisen sich als gleichberechtigte Bestandteile einer Ra- 
diorhetorik wie die Sprechpassagen der Moderator*innen. Auch (oder gerade) bei 
Moderationen mit hoch standardisierten, häufig wiederholten und wenig informa- 
tiven Inhalten wie den Three Element Breaks spielen Verpackungselemente eine 
tragende Rolle. Wenn Moderator*innen ihre Äußerungen kunstvoll mit Bumpern, 
Musikbetten und Show Openern verschränken, können sie besonders üppige Wir- 
kungen erzielen. Der Ornatus kommt dabei zu wesentlichen Teilen durch Verpa- 
ckungselemente zustande, während die verbalen Moderationsanteile häufig sogar 
zurücktreten. Die Kunstfertigkeit der Moderator*innen besteht darin, die ver- 
schiedenen Elemente im Moment des Sendens so passgenau und dynamisch mit- 
einander zu verweben, dass ein lebendiger Fluss entsteht, welcher erst in seiner 
Gesamtheit die gewünschte Wirkung entfaltet (vgl. auch Münch 1995, 176). 


Die Beobachtungen zu den Three (bzw. Five) Element Breaks im TRE-Korpus 
zeigen über Länder- und Sprachgrenzen hinweg übereinstimmend: Es handelt 
sich überwiegend um eine routinisierte, formelhaft-standardisierte drei- oder fünf- 
schrittige Struktur, die durch das häufige Vorkommen vorhersehbar ist und sich 
damit gut eignet, eine Sendung zu strukturieren. Die Breaks werden genutzt zur 
Selbstpräsentation der Moderator*innen und zur Kontaktaufnahme mit den Hö- 
rer*innen, vor allem aber zur Präsentation des Sender-Images, also auch zur Ab- 
grenzung von ähnlichen Programmen. Three Element Breaks verankern die Sen- 
dung im Hier und Jetzt. Sprachlich sind sie schlagzeilenartig gestaltet: knapp, 
kurz, klar (Brevitas und Perspicuitas). Stimmlich-artikulatorisch sind die Breaks 
aufwändig und aufmerksamkeitsheischend gestaltet (Ornatus). Überwiegend wer- 
den sie mit hoher Sprechspannung laut gesprochen oder gerufen, sie enthalten 
viele und starke Akzente, so dass eine Rhythmisierung entsteht. Der Spannungs- 
bogen ist oft klimaktisch gestaltet, mit einer stimmlichen Pointe am Ende. Für alle 
Breaks gilt, wenn auch in unterschiedlichem Ausmaß gemäß der Programmiden- 
tität, dass Verpackungselemente gleichberechtigte Bestandteile der drei- oder 
fünfschrittigen Struktur sind und den klimaktischen Aufbau unterstützen. Es ent- 
stehen sprachlich-klangliche Hybridprodukte. 
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Die kurzen Zwischenmoderationen in Form von 3EBs oder 5SEBs sind zwar nicht 
inhaltsleer, aber die Information über Sachverhalte (docere) steht nicht im Vor- 
dergrund, sondern das Erzeugen von Vergnügen, Emotion und Hörerbindung (de- 
lectare, movere, conciliare). Dafür werden Wort und Klang virtuos und varianten- 
reich klimaktisch miteinander verschränkt. Einen Sonderfall stellt die „Halbarie“ 
dar. Sie ist erheblich schlichter gestaltet und rahmt ein längeres wort- und infor- 
mationsreiches Programmelement. 


Das Verhältnis zwischen den verbalen Moderationsanteilen und der Verpackung 
variiert je nach Programmsituation und angewendeter produktionstechnischer 
Raffinesse. Beim ecuadorianischen Sender La Bruja ist die Moderatorin auf ihre 
Stimme, den gespielten Musiktitel und den Lautstärkeregler beschränkt; vorpro- 
duzierte Verpackungselemente kommen nicht zum Einsatz. Die Kernbotschaft 
dieses 3EB beschränkt sich auf die Kenntlichmachung des Senders und seiner 
Claims. 


Beim österreichischen Sender Live Radio setzt die Moderatorin einen Sounder 
und einen Bumper mit insgesamt fünf unterscheidbaren Elementen präzise getimt 
und unterstützt durch ein elektronisch geregeltes Gating ein. Die Passage fokus- 
siert darauf, das Sender-Event möglichst reizvoll erscheinen zu lassen, um mög- 
lichst viele Hörer*innen zur Teilnahme zu bewegen und den Sender als aktiv und 
hörernah darzustellen. 


Beim französischen Sender Fun Radio sind die Verpackungselemente rhyth- 
misch, melodisch und instrumentatorisch noch gehaltvoller ausgeführt. Insgesamt 
zehn vorproduzierte Sound- und Sprach-Bestandteile werden innerhalb der Ver- 
packungselemente aneinandergereiht oder geschichtet. Sie leiten auf eine Pointe 
hin, die keinerlei Nachrichtenwert, sondern allein soziale Relevanz besitzt: die 
Rückkehr des Star-Moderators Bruno und das Angebot einer parasozialen Bezie- 
hung zu ihm. 


Das letzte Beispiel des Senders SWRI weist eine geringere Dichte vorproduzier- 
ter Bestandteile auf und enthält weder Sounder noch vorproduzierte Sprachse- 
quenzen. Drei Variationen des musikalischen Sender-Logos und ein abschließen- 
der Show Opener rahmen die insgesamt ca. fünfminütige Passage. Die 
Gesamtkonstruktion fokussiert aber nicht die sprachlich vermittelten Inhalte der 
Verkehrsmeldungen, Nachrichten und Wetter, die diese Passage eigentlich aus- 
machen, sondern die nachfolgende Musik, die in Unterhaltungsformaten wie die- 
sem in Rotation teils mehrmals am Tag wiederholt wird und somit keinen Neuig- 
keitswert besitzt. Zu diskutieren wäre, ob damit ein Widerspruch zum 
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informationsorientierten Kommunikationsanspruch der Servicepassage besteht 
oder eine Verbindung geschaffen wird, so dass die informationsorientierte Ser- 
vicepassage nicht aus der Anmutung des Programms herausfällt, sondern „einge- 
bettet“ erscheint. 


Insbesondere die Beispiele von Live Radio und Fun Radio verwenden gespro- 
chene Moderationsanteile und Verpackungselemente zum Zweck des Sign Pos- 
ting. Nach Shingler / Wieringa (1998, 136) bedeutet dies die Markierung eines 
bestimmten Bestandteils, Moments oder Wechsels im Broadcast Flow. Sign Pos- 
ting ersetzt im Zeitmedium Radio das Inhaltsverzeichnis, die Headlines oder die 
Rubrikenkennzeichnung, die im Raummedium Zeitung durch die räumliche An- 
ordnung auf dem Zeitungstableau gängig sind (Crisell 1986/?1996, 6). „Radio has 
nothing but different sounds, some of which it uses to establish the beginnings 
and ends of programmes for us [...]” (Shingler / Wieringa 1998, 8). Diese Sign 
Postings signalisieren den Hörer*innen mittels spezieller Sounds die Linien und 
Wechsel der Programmstruktur. 


In einem folgenden Schritt könnte untersucht werden, in welchem Verhältnis er- 
kennbare Kommunikationswirkungen und dafür verwendete Sendebestandteile 
der 3EBs oder 5EBs zu übergeordneten Zielen des jeweiligen Senderbetriebs ste- 
hen. Privatkommerzielle Radiosender stellen ökonomisch einen speziellen Fall 
dar, weil sie nicht ihr eigentliches Produkt, das Radioprogramm selbst, vermark- 
ten, sondern seine Transportkapazität für Werbung. Aus ökonomischer Sicht müs- 
sen Radiobetreiber*innen daher danach streben, die Transportkapazität des Me- 
diums so zu steigern, dass möglichst viel Werbung gespielt werden kann, ohne 
Zuhörer*innen zu vergraulen. Unter diesen Bedingungen werden die beschriebe- 
nen Mechanismen umso sinnfälliger. 
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„Und dann fühlt man, als ob der Moderator das, äh, 
so eigentlich fühlt“ 
Wie deutsche und kanadische Hörerinnen und Hörer 
Radiomoderationen beschreiben 


Grit Böhme, Halle (Saale) / Sonja Kettel, Leipzig 


Radiosender sind oft auf lokale Zielgruppen ausgerichtet, ihr Programmdesign ist 
allerdings stark beeinflusst durch US-amerikanisches Formatradio sowie die 
BBC. Beeinflusst das die Artund Weise, wie Hörer*innen aus verschiedenen Län- 
dern Radioformate und -stile wahrnehmen und kategorisieren? Die hier vorge- 
stellte qualitative Untersuchung geht dieser Frage nach und vergleicht, wie Ra- 
diohörer*innen aus Deutschland und Kanada auf dieselben Moderationsstile 
reagieren. Die Ergebnisse deuten an, dass Programmpräferenzen ein bedeutsame- 
rer Einflussfaktor sein könnten als das Herkunftsland, um Unterschiede in den 
Reaktionen zu erklären. 


1 Einleitung 


Radiomoderationen sind — im Sinne Baumans (1975) — Performances. Die Spre- 
cher*innen begeben sich vor dem Mikrofon in eine herausgehobene Position, ähn- 
lich wie auf einer Bühne. Damit vermitteln sie nicht nur Inhalte, sondern laden ihr 
Publikum immer auch ein, die Präsentationen daraufhin zu bewerten, wie ange- 
messen, wie kunstfertig und gewandt den Moderator*innen ihre Darstellung ge- 
lungen ist (vgl. auch Bell / Gibson 2011). Die stilistische Gestaltung spielt vor 
allem in solchen Bereichen eine Rolle, die nur wenigen Sachzwängen unterliegen, 
wodurch Spielräume für die freie Formbildung entstehen. Dies wiederum bietet 
„besonders günstige Voraussetzungen für die Ausbildung kultureller Stile [...], 
deren einzige Funktion der Verweis auf und die Selbstvergewisserung über kol- 
lektive ‚Verhaltungsformen der Seele‘ bzw. über intellektuelle und emotionale 
Strukturen und Dispositive ist“ (Linke 2009, 1138). Das gilt prototypisch für 
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künstlerisches Schaffen, in besonderer Weise aber auch für Medienkommunika- 
tion jenseits traditionell mit Kunst assoziierter Genres (vgl. u. a. Coupland 2007, 
146 ff.). Radiomoderatoren und -moderatorinnen versuchen über den Stil, in dem 
sie sich selbst darstellen und ihre Hörerschaft ansprechen, ihrer Zielgruppe eine 
Identifikationsfläche zu bieten. Dazu greifen sie in der Gesellschaft bereits etab- 
lierte Stile und Muster auf, von denen sie erwarten, dass ihr anvisiertes Publikum 
sie für angemessen hält und positiv bewertet (vgl. Bell 2001; Tolson 2006, 20, 52; 
Bose / Föllmer 2015). Die Entscheidung, welche dieser Identifikationsangebote 
die Hörer*innen annehmen oder auch ablehnen, können sie — durch die fehlende 
Verbindlichkeit — beim Radio wesentlich kompromissloser fällen als in vielen 
nichtmedialen Settings (vgl. Scannell 1991; Schramm / Hartmann 2010). Auf- 
grund dieser Freiheit eignet sich die Wahl des eigenen Medienrepertoires generell 
sehr gut, um soziale Gruppenzugehörigkeiten zu bestätigen und überdies nach au- 
Ben zu vermitteln. Daher ist davon auszugehen, dass soziale Bewertungen und 
Distinktionsprozesse hier besonders offen und deutlich zum Ausdruck gebracht 
werden — über Geschmack lässt sich bekanntlich nicht streiten (vgl. Bourdieu 
1987, 405 ff.; Trepte 2006; Hoffmann / Kutscha 2010). 

Diese Annahme bestätigte sich u. a. in einer Untersuchung von Böhme (2019), 
in der sie ein Beschreibungsprofil erstellte für den typischen Moderationsstil eines 
Radiosenders im Vergleich zu Moderationsstilen anderer Sender, die in derselben 
Region zu empfangen sind — formuliert aus der Sicht der eigenen Zielgruppe. Der 
untersuchte Sender war in diesem Falle das öffentlich-rechtliche deutsche Ju- 
gendradio MDR Sputnik. Auf Basis dieser Arbeit entstanden noch zwei weitere 
Untersuchungen: In Vortests hatte sich angedeutet, dass Rezipienten und Rezipi- 
entinnen von Kulturformaten Moderationsstile in sehr anderer Weise beschreiben 
und bewerten als solche, die Jugendradios bevorzugen. Auf Grundlage dieser Be- 
obachtung führte Böhme (2016) gemeinsam mit Studierenden eine Befragung mit 
Hörer*innen des öffentlich-rechtlichen Kulturradios MDR Figaro durch, die in 
derselben Region lebten und in Alter und Bildungsgrad vergleichbar waren mit 
den Teilnehmenden aus der ursprünglichen Untersuchung. In einer weiteren Stu- 
die befragte Kettel schließlich deutschsprachige Radiohörer*innen in Kanada, die 
in demografischer Hinsicht den Proband*innen aus den beiden anderen Befragun- 
gen ebenfalls äquivalent waren (Alter zwischen 18 und 29 Jahren, größtenteils 
Studierende). Alle drei Untersuchungsgruppen wurden mit derselben Inter- 
viewmethode befragt und mit denselben Moderationsstimuli konfrontiert. 

Die Erhebung in Kanada hatte folgenden Hintergrund: Zwar sind Radiopro- 
gramme meist auf die Bedürfnisse lokal definierter Zielgruppen zugeschnitten, 
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gleichzeitig ist Radio aber ein sehr globalisiertes Medium. Die gesamte Pro- 
grammgestaltung ist weltweit stark geprägt durch das US-amerikanische Format- 
radio und die BBC (vgl. Berland 1993; Hilmes 2004; Krug 2010, 43 ff.). Wenn- 
gleich es hierzu noch keine kulturvergleichenden Studien gibt, kann daher 
angenommen werden, dass sich dies auch auf die Gestaltung der Moderation aus- 
wirkt (ähnlich wie es z. B. auch bei Fernsehnachrichten der Fall ist, vgl. Lugin- 
bühl 2014). Ziel dieser explorativen Studie war es, herauszufinden, wie Hörer*in- 
nen, die zwar fließend Deutsch sprechen, aber nicht in Deutschland und mit 
dessen Radiolandschaft sozialisiert sind, auf die deutschen Radiomoderationen 
reagieren. Deren Reaktionen sollten dann mit denen der deutschen Interviewten 
verglichen werden. Im vorliegenden Artikel sollen ausgewählte Ergebnisse, ei- 
nige Ähnlichkeiten und Unterschiede in den Beschreibungen der verschiedenen 
Hörergruppen aufgezeigt und diskutiert werden. 


2  Methodisches Vorgehen 


Als Stimulusmaterial für die Interviews wurden zunächst aus 58 Stunden aufge- 
zeichnetem Radioprogramm Moderationsmitschnitte von 6 bis 12 Sekunden 
Länge ausgeschnitten. Diese enthielten ausschließlich gesprochene Moderation, 
keine Musik, keine Stadion-IDs, Jingles oder andere sog. Verpackungselemente. 
Die Stimuli teilten sich dabei in zwei Gruppen auf: Einerseits Moderationen des 
untersuchten Senders MDR Sputnik und andererseits Mitschnitte von anderen 
Sendern aus derselben Region, darunter auch Moderationen von MDR Figaro. In 
einem ersten Schritt wurde in einer Online-Befragung mit über 1200 Sputnik-Hö- 
rer*innen ein Wiedererkennungstest durchgeführt (vgl. Böhme 2014). Aufdiesem 
Wege konnten die weniger typischen Sputnik-Moderationen aus dem Stimulus- 
Pool herausgefiltert werden und ebenso diejenigen Moderationsmitschnitte der 
anderen Sender, die am häufigsten mit Sputnik-Moderationen verwechselt wur- 
den. 

Ziel des nächsten Schrittes war es nun, Beschreibungen von Hörer*innen zu 
sammeln. Das Vorgehen lehnte sich hierbei an die Repertory-Grid-Methode an, 
ein teilstrukturiertes Interview-Verfahren, das bislang noch nicht für die Untersu- 
chung von Sprechstilen angewendet worden war (eine kurze Übersicht zu ver- 
schiedenen Varianten und Anwendungsbereichen der Methode findet sich u. a. 
bei Fromm 2002). Den Interviewten wurden immer jeweils drei Stimuli hinterei- 
nander vorgespielt. Diese waren zufällig gewählt, jedoch unter der Bedingung, 
dass sich in jeder Triade mindestens eine, maximal zwei Sputnik-Moderationen 
befanden. Nach dem Hören wurden die Proband*innen gefragt, welche zwei der 
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drei Moderationen sie ähnlicher zueinander finden und welche ihrer Einschätzung 
nach anders ist. Daraufhin sollten sie in eigenen Worten beschreiben, inwiefern 
sich die beiden Moderationen ähneln und in welcher Hinsicht sich die übrige Mo- 
deration davon unterscheidet. Im Anschluss wurde dann die nächste Triade vor- 
gespielt und der Prozess wiederholt, bis jede Probandin und jeder Proband am 
Ende 16 Triaden, also 48 Moderationsmitschnitte nach wahrgenommenen Ähn- 
lichkeiten und Unterschieden eingeteilt und beschrieben hatte. Pro Interview wur- 
den immer jeweils zwei Hörer bzw. Hörerinnen gleichzeitig befragt, um sie in der 
Interaktion miteinander beobachten zu können und um die Gesprächsatmosphäre 
etwas alltagsnäher zu gestalten. 

Durch dieses sehr offene Befragungsformat lässt sich untersuchen, ob und in 
welcher Weise die Befragten den Sprechstil von verschiedenen Moderationen 
desselben Senders als kohärent, als ähnlich zueinander wahrnehmen und wie sie 
ihn jeweils von anderen Moderationsstilen abgrenzen. Da Sprechstile als Mittel 
zur Distinktion in der Regel vor dem Hintergrund möglicher alternativer Stilfor- 
men gedeutet werden, ist es sinnvoll, sie auch methodisch nicht isoliert zu be- 
trachten, sondern sie in Beziehung zu anderen relevanten Sprechstilen zu setzen 
(vgl. Irvine 2001; Linke 2009; Gal 2016). Dazu bietet die Repertory-Grid-Me- 
thode eine Möglichkeit (eine ausführliche Beschreibung des methodischen Her- 
angehens ist bei Böhme 2015 und insbesondere Böhme 2019, 79 ff. nachzulesen). 

Mit den Sputnik-Hörer*innen aus der ersten Untersuchung wurden nach diesem 
Vorgehen 16 Interviews mit insgesamt 32 Teilnehmenden durchgeführt. In der 
zweiten Untersuchung wurden 11 Interviews mit 22 Hörer*innen von MDR Fi- 
garo erhoben. Zuletzt wurden in der dritten Untersuchung in 7 Interviews 14 Pro- 
band*innen befragt, die in Kanada lebten und dort auch überwiegend sozialisiert 
waren. Ursprünglich sollte dieses Probandensample ausschließlich aus Personen 
bestehen, die der deutschsprachigen Minderheit in Kanada angehören. Es hatte 
sich allerdings als schwierig erwiesen, dabei Teilnehmende in der Altersgruppe 
zwischen 18 und 29 Jahren zu finden, die Deutsch auf erstsprachlichem Niveau 
sprechen, da diese meist in der dritten oder vierten Generation in Kanada leben 
und Deutsch im Alltag kaum noch verwenden (vgl. auch Prokop / Bassler 2008). 
Um die Befragten dennoch mit der Altersgruppe der übrigen Interviewten ver- 
gleichbar zu halten, wurde der Probandenkreis erweitert. Voraussetzung war es 
nun, dass sie fließend Deutsch sprachen. 

Alle erhobenen Interviews wurden als Audioaufnahmen aufgezeichnet und 
dann nach schriftsprachlichen Regeln transkribiert, wobei eine möglichst große 
Nähe zur mündlichen Form angestrebt wurde. Die Auswertung der Daten erfolgte 
anschließend im Analyseprogramm MAXQDA mit einer Mischung aus quantita- 
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tiven Methoden (Welche Beschreibungen kommen über mehrere Interviews hin- 
weg am häufigsten vor und sind für die jeweiligen Sender am exklusivsten?) und 
einem an den Verfahren der Grounded Theory orientierten Vorgehen (Was be- 
deuten die Beschreibungen? Lassen sich zugrundeliegende Dimensionen finden?) 
(vgl. Corbin / Strauss 2015; vgl. auch Böhme 2019, 97 ff.). 


3 Die lachende Moderatorin — ein Analysebeispiel 


Die Auswertung — insbesondere die der Figaro-Interviews — ist noch nicht voll- 
umfänglich abgeschlossen. Doch bereits in einem ersten Analysedurchlauf deu- 
tete sich an, dass unterschiedliche Programmvorlieben einen wesentlichen Ein- 
fluss darauf haben, wie die Interviewten die Moderationen einordnen, bewerten 
und beschreiben. Möglicherweise ist dieser Faktor sogar bedeutsamer als der, in 
welchem Land die Hörer*innen jeweils sozialisiert wurden. Dies sei hier anhand 
eines Beispiels illustriert, in dem die Reaktionen aller drei Befragtengruppen auf 
einen konkreten Moderationsstimulus miteinander verglichen werden sollen. Der 
gewählte Stimulus (siehe Transkript 1) stammt aus dem Programm des Jugendra- 
dios MDR Sputnik. Er enthält einen Gesprächsausschnitt zwischen der Mornings- 
how-Moderatorin WB und ihrem Co-Moderator RF. Um nachvollziehbar zu ma- 
chen, worauf sich die im Folgenden erläuterten Beschreibungen der Hörer*innen 
beziehen, ist der Stimulus hier zunächst nach den Konventionen von GAT2 
transkribiert (vgl. Selting et al. 2009). Als Audio ist der Stimulus verfügbar über 
den QR-Code zu Beginn des Artikels bzw. unter: 
https://cloud.uni-halle.de/s/zr7UBJi4TidH309. 


01 WB: °hh in STUTTgart definitiv, 

02 <<:-)>un_noch drei ANdern städten; 

03 sie WISsen aber noch nich wO. 

04 (.) [ähi] hi> 

05: -RE; [hm.] 

06 (.) hAlt das irgnwie- 

07 also ich hAlte die meTHoden irgnwie für wie soll ich 

08 SAgen; 

09 WB: (.) [NICH ] 

10 RF: [<<:-)>°h FRAG]würdig?//> 

11 WB: ja nIch ganz ZEITgemäß irgnwie. 
((stimmloses nasales Auflachen)) 


Transkript 1: Moderationsstimulus (S 153 S) aus der Sputnik-Morningshow mit Moderatorin 
WB und Moderator RF (Audio 1) 
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Wie sich im weiteren Verlauf dieses Artikels noch zeigen wird, spielen klangliche 
Aspekte von Radiomoderation für die befragten Hörer*innen eine wichtige Rolle 
(vgl. auch Böhme 2013; 2019, 256 ff.; Bose / Föllmer 2015). Die stimmlich-arti- 
kulatorischen Merkmale der Moderation werden daher an dieser Stelle zusätzlich 
beschrieben mithilfe des Merkmalskataloges zur auditiven Deskription von 
stimmlich-artikulatorischen Ausdrucksmustern nach Bose (2003, 38 ff., 413 f. so- 
wie 2010). 

WB wie auch RF sprechen beide mit sehr bewegter, sprunghafter Sprechmelo- 
die mit Tonhöhensprüngen von bis zu einer Oktave — z. B. von der Endsilbe von 
„sagen“ zu „nich“ in Zeile 7 bis 8. Auch das Lachen der Moderatorin in Zeile 4 
bewegt sich von der zuvor erreichten Lösungstiefe um eine Oktave auf „ähi“ und 
steigt auf „hi“ noch um eine kleine Terz weiter an. Lautheit und Sprechspannung 
sind durchweg hoch, ebenso die Sprechgeschwindigkeit, die sich gerade bei WB 
in unbetonten Silben deutlich auf die Artikulationspräzision auswirkt. Akzente 
sind bei beiden Sprechenden sowohl dynamisch als auch melodisch stark hervor- 
gehoben (insbesondere auf „Stuttgart“ in Zeile 1, „nich“ in Zeile 8 sowie „frag- 
würdig“ in Zeile 9), was dem gesamten Moderationsausschnitt einen gewissen 
Staccato-Rhythmus verleiht. Unterschiede zwischen der Moderatorin und dem 
Moderator sind vor allem stimmlicher Natur. Die faukale Distanz ist bei RF zwar 
etwas verengt, die Stimme ist aber dennoch relativ klangvoll. Seine Stimmlage 
liegt im mittleren Bereich, die Klangfarbe ist dabei eher hell. Der Stimmklang von 
Moderatorin WB ist dagegen auffallend rau, aber auch anteilig heiser und be- 
haucht. Insbesondere ihr Lachen in Zeile 4 hat einen hohen Geräuschanteil, ist 
fast aphonisch. Die Ein- und Ausschwingphasen sind — u. a. aufgrund der hohen 
Sprechspannung und der faukalen Enge — sehr hart, oft knarrend (auffällig vor 
allem nach dem wortinitialen Glottisschlag von „andern“ in Zeile 2 und im unbe- 
tonten Teil von „fragwürdig“ in Zeile 9). Ihre Stimmlage ist für eine Frauen- 
stimme eher tief. Die Artikulationsweise deutet bei RF wie auch WB durchgehend 
auf eine tendenziell gespreizte Lippenstellung hin, bei Moderatorin WB ist die 
Smile Voice von Zeile 2 bis 4 und in Zeile 9 allerdings besonders deutlich heraus- 
zuhören. 


3.1 Reaktionen der deutschen Jugendradiohörer und -hörerinnen 


In den Interviews mit Hörer*innen von MDR Sputnik fällt zunächst mehreren 
Befragten die Stimme der Moderatorin auf: 


50 © Frank & Timme Verlag für wissenschaftliche Literatur 


S22: [..] Und als ich die ersten Male WB gehört hatte, dachte ich so, 
oh mein Gott, die ist verdammt heiser, das ist doch die untypischste 
Radiomoderatorin überhaupt (lacht). Fand ich am Anfang ganz schreck- 
lich, jetzt ist es mir so sympathisch, weil es eben nicht so geleckt 
wirkt. 


Auszug 1 (Sputnik Int. 11, Abs. 182) 


In anderen Interviews heißt es, ihre „brüchige Stimme“ habe „auch wieder was 
Persönliches, sowas anderes, dass das anders rüberkommt“ (Sputnik Int. 6, Abs. 
273). Bei der Untersuchung eines umfangreichen Korpus deutschsprachiger Mor- 
ningshow-Moderationen haben Bose und Finke (2016, 86) einen generellen Wan- 
del des Stimmideals im Radio beobachtet: „Während bisher im Radio Spre- 
cher/innen mit ausgebildeten, klangvollen (eher dunklen) Stimmen und 
Standardaussprache bevorzugt wurden, sind jetzt vielfach (scheinbar) unausgebil- 
dete Stimmen zu hören, mehr oder weniger stark geräuschhaft bis pathologisch- 
angestrengt (eng, rau, knarrend, undicht).“. Eine auffällige, „untypischste“ 
Stimmgebung (Auszug 1) kann den Wiedererkennungswert von Moderatoren und 
Moderatorinnen erhöhen und so einen Beitrag zur Markenidentität des gesamten 
Senders leisten — die auf dem umkämpften Radiomarkt zunehmend relevanter 
wird. Hörbar ausgebildete Sprecher*innen kommen fast nur noch im Kulturradio 
vor, viele Programmchefs von populären Begleitprogrammen lehnen diese jedoch 
als „zu perfekt, glatt und distanziert geradezu ab.“ (Bose / Finke 2016, 86; vgl. 
auch Fleming 2010, 62; Mücksch 2015). Hörerreaktionen wie im Auszug 1 haben 
sozusagen einen solchen Wandel von der professionellen Stimme hin zur Stimme 
von nebenan vermutlich ebenfalls vorangetrieben. 

Dass Sputnik-Moderationen insgesamt weniger „geleckt“ wirken, hat aber auch 
damit zu tun, dass sie nach Ansicht vieler Hörer*innen spontan formuliert klin- 
gen. Das machen sie u. a. daran fest, dass sich der Sprecher und die Sprecherin 
„immer so gegenseitig ins Wort“ fallen und sich „über, äh, so Wortfindungs- 
schwierigkeiten drübergeholfen“ haben (Sputnik Int. 8, Abs. 118; Sputnik Int. 3, 
Abs. 156). Aber auch das Lachen und die Smile Voice der Moderatorin scheinen 
einen Einfluss zu haben. Das Lachen wird jedenfalls in fast jedem Interview the- 
matisiert: 


S20: [..] [weil G.B.] die sich ja doch nun auch sehr mit sich selbst 
unterhalten haben und halt auch mal gelacht haben, was zeigt, dass, 
äh, sie jetzt nicht davorstehen mit einem Blatt Papier und das ein- 
fach alles nur so runterrattern. 


Auszug 2 (Sputnik Int.10, Abs. 39) 
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S22: Mmh, mmh. Ja stimmt, also das dritte Beispiel kommt mir auch, 
ähm, was du gerade sagtest, die kommen mir dadurch auch so natür- 
lich vor, weil das wirkt nicht so, als würde sie jetzt gerade la- 
chen, weil sie weiß, oh, jetzt muss ich gleich das und das sagen, 
so und an der Stelle muss ich bestimmt lachen dann so ha ha (alle 
lachen). Weil damit die Zuhörer auch lachen. Das wirkt auf mich 
also sehr natürlich, nicht geplant. 


Auszug 3 (Sputnik Int.11, Abs. 182) 


Wie die Auszüge 2 und 3 bereits andeuten, ist der Eindruck, dass hier spontan 
„natürlich[e]‘“ Emotionen geäußert werden, ein wichtiges Kriterium für die Au- 
thentizität einer Moderation (vgl. auch Böhme 2019, 205 ff.). Im folgenden Aus- 
zug wird dies noch deutlicher: 


S19: [..] Also, das hängt dann wahrscheinlich auch schon zusammen, 
dass man das Gefühl hat, es kommt spontan. 


S20: Genau. 


S19: Von, von innen heraus und nicht, ähm, so vorgegeben, dass man 
da eine Richtlinie hat, die man da versucht irgendwie einzubasteln. 
Und, ähm, ich finde auch, die, sie haben Humor und das merkt man, 
das, das kann nur persönlich sein. Also man kann ja nicht humorvoll 
sein, wenn man es aufgezwungen bekommt. Sondern, ähm, dass die Mo- 
deratoren selber einen Humor mitbringen, den sie auch gut verarbei- 
ten können mit den Texten, die sie dann, oder mit den Inhalten, die 
sie verbinden sollen. Und dass ich dadurch auch mitlachen kann, 
weil es eben ungezwungen klingt. 


Auszug 4 (Sputnik Int.10, Abs. 42-44) 


Das Lachen wird oft als ansteckende gute Laune erlebt, es „tut [...] sehr animie- 
ren sozusagen, äh, auch selber, ja, ein bisschen lustig zu sein“ (Sputnik Int. 6, 
Abs. 267). Hörbar gute Laune wiederum gilt für die Interviewten als sender- und 
formattypisch: 


S28: Diese, äh, Menschen da von Sputnik oder von diesen jüngeren 
Sendern, die wirken auch immer ein bisschen fröhlicher so. Also 
nicht nur, weil die jetzt so gelacht hat, sondern also gerade am 
Anfang dieses dritten Soundschnipsels, wo die noch nicht gelacht 
hat, da hat man das schon so rausgehört so, gute Laune so, als, als 
feiert die sich gerade über irgendwas oder so. Irgendwie wirkt das 
immer ein bisschen fröhlicher und, äh, offener. So. 


Auszug 5 (Sputnik Int.14, Abs. 293) 
Offenbar erzeugt das Lachen auch einen Eindruck von Nähe (zur identifikations- 
stiftenden Funktion von gemeinsamem Humor und Lachen und deren gezielten 


Einsatz in den Massenmedien vgl. auch Knop 2007, 63): 
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S26: [..] Und, äh, ja also dieses, gerade dieses Gespräch ist halt, 
finde ich, auch sehr hörernah, weil das ja auch im Alltag 
stattfindet. Also, ja. 


S25: Ja, [..] die haben auch miteinander gelacht und haben ein eige- 
nes Gespräch geführt, wo man einfach nur reingeholt wurde irgend- 
wie. Ähm, ja, und, also für mich gleichen sich eins und drei sehr, 
das war wieder mit mehr Freude und freier, ja? 


Auszug 6 (Sputnik Int.13, Abs. 146-147) 


Wenn die Sputnik-Hörer*innen die Beispielmoderation als „mehr so alltäglich“ 
beschreiben, als „mehr intergiert irgendwie in unser Zeitleben“ (Sputnik Int. 2, 
Abs. 45), so ist das durchweg positiv konnotiert als „einfach so aus dem Leben 
gegriffen“ und „was man selbst auch immer erlebt“ (Sputnik Int. 9, Abs. 112) und 
bietet ihnen augenscheinlich Identifikationsmöglichkeiten. In unterhaltungsorien- 
tierten Begleitprogrammen wie MDR Sputnik greifen Radiomoderator*innen üb- 
licherweise bewusst Merkmale und Genres informeller Alltagsgespräche auf, um 
— trotz massenmedialer Verbreitung — Nähe zu ihrem Publikum aufzubauen. Sie 
inszenieren sich ihrer Zielgruppe gegenüber als „eine/r von ihnen“, um diese zur 
Identifikation einzuladen und emotional an das Programm zu binden (vgl. 
Fairclough 1994; Tolson 2006, 9 ff., 20, 52; Wasian 2008, 86 f., 151). Durch die 
Gestaltung soll den einzelnen Hörenden das Gefühl gegeben werden, als würden 
die Moderator*innen sie persönlich ansprechen. Auch bei Doppelmoderationen, 
die in solchen Programmen gerade in Morningshows sehr verbreitet sind, soll das 
Publikum als virtueller Gesprächspartner miteinbezogen werden (vgl. Geißner 
1993, 59; Crisell 1994, 68; Burger / Luginbühl 2014, 334 ff.). Bei den beiden Pro- 
bandinnen S25 und S26 (siehe Auszug 6) scheint diese beabsichtigte Wirkung 
offenkundig gelungen zu sein. 

Deutlich anders als das vorgestellte Moderationsbeispiel nehmen die Interview- 
ten Figaro-Moderationen wahr. Diese beschreiben sie als distanziert, abgelesen, 
monoton, langweilig, teilweise auch als arrogant — und „halt schon höher als ir- 
gendwie so ein Alltagsgespräch“ (Sputnik Int. 3, Abs. 375). Oft fühlen sich die 
Hörer*innen an öffentliche Vortragssituationen erinnert (Vorlesungen, Reden von 
Politikern). Als besonders negativ wird immer wieder hervorgehoben, Figaro- 
Moderator*innen wirkten emotionslos oder gar gelangweilt (vgl. Böhme 2015 so- 
wie 2019, 142 ff.). So etwas wie Lachen ist aus Sicht der Jugendradiohörer*innen 
in Kulturformaten wie z.B. dem „Wort-Kultur-Programm“ Deutschlandfunk 
(DLF) ausgeschlossen (vgl. Geißner 2017, 365): 
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S14: OK, also da ist mir ganz wichtig aufgefallen, ähm, im ersten, 
äh, da lacht WB einfach mal während Aufnahme. Das ist beis, bei so 
einem DLF ist das gar nicht denkbar, also das ist ja... 


S13: Gibt es ja auch nix zu lachen. 
S14: Ja, eben (alle lachen). Also das war wieder ganz eindeutig, 


ähm, ähm, im, im ersten haben sie wieder frei nach der Schnauze weg 
über ein Thema geredet, was halt gerade wichtig ist. 


Auszug 7 (Sputnik Int.7, Abs. 135-137) 


3.2 Reaktionen der deutschen Kulturradiohörer und -hörerinnen 


Hörer*innen von MDR Figaro empfinden Lachen ebenfalls als eher untypisch für 
das Kulturradioformat. Sie bewerten alltäglich, spontan und gesprächshaft wir- 
kende Moderationsstile allerdings in sehr anderer Weise als die Befragten, die 
MDR Sputnik zu ihren Lieblingssendern zählen: 


F03: Find, find, man, man merkt das auch so ein bisschen, ob sich 
die Leute zusammennehmen, bevor sie anfangen zu sprechen oder ob 
man merkt, dass sie sich, was bei, ähm, bei so Moderatorenpaaren, 
dass man halt merkt, dass sie sich, während das Lied lief oder die 
Werbung, schon darüber unterhalten haben und jetzt mit nem Lacher, 
weil sie gerade sowieso im Gespräch sind, äh, damit einsteigen. 
Also das gibt es, glaub ich, selten irgendwie bei Figaro. [..] Aber, 
wenn ich jetzt nicht so, also ich mein, ich kann ja mit dem Radio 
nicht reden, also mir bringt das jetzt nicht wahnsinnig viel, zu 
wissen, dass die jetzt schon zehn Minuten lang drüber gequatscht 
haben und jetzt mir noch unbedingt mitteilen, worüber sie sich Lus- 
tiges unterhalten haben. 


Auszug 8 (Figaro Int. 2, Abs. 271-280) 


Klingt eine Moderation geplant, so wird dies hier als Qualitätsmerkmal aufgefasst 
und steht für sorgfältige Vorbereitung: „Das, ähm, suggeriert mir den Eindruck, 
dass er eher nachgedacht hat, was über, was er erzählt. Und es ist nicht so, ich 
spreche jetzt das aus, was mir gerade ins Hirn kommt“ (Figaro Int. 7, Abs. 112- 
113). Im folgenden Auszug vergleicht Probandin F02 eine Figaro-Moderation (in 
der Triade an letzter Stelle) mit der weiter oben beschriebenen Beispielmodera- 
tion des Sputnik-Morningshow-Teams (in der Triade an erster Stelle): 
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F02: Ähm ja, bei dem letzten ist wieder direkt von Anfang an ein- 
fach, ähm, ruhig. Wieder so, als wäre es, äh, schon öfter mal ir- 
gendwie, äh, geübt worden oder weiß ich nicht, ob abges abgelesen 
wird oder so. Auf jeden Fall ganz entspannt die Infos gegeben. Und 
bei den ersten beiden wieder bäm bililililim und, äh, ich ja, pene- 
triert mein Gehör (lacht). 


Auszug 9 (Figaro Int. 1, Abs. 296) 


Was die Interviewten aus dem Sputnik-Sample als „hörernah“ beschreiben (Aus- 
zug 6), wirkt auf die Figaro-Hörer*innen „aufdringlic“ (Figaro Int. 1, Abs. 265). 
Dies wird von mehreren Befragten vor allem mit der Lautheit, dem Tempo und 
dem großen Melodieumfang der Moderatorin und des Moderators in Verbindung 
gebracht. So vollzieht Probandin F02 beispielsweise von „bäm“ zu „bililililim“ 
einen Tonhöhensprung von einer kleinen Sexste, der sich deutlich von der umge- 
benden Sprechweise abhebt. Es kann angenommen werden, dass sie damit ver- 
sucht, die Melodiebewegungen innerhalb der Moderation zu charakterisieren, die 
sie anscheinend als unangenehm eindringlich empfindet. Auch Proband F05 fin- 
det die Moderation unangenehm. Er kann die Moderatorin WB u. a. aufgrund ih- 
rer „Stimmstörung |...] auf jeden Fall nicht leiden“ (Figaro Int. 7, Abs. 94). 
Ebenso nimmt er ihr Lachen als störend wahr: 


F05: Also das erste hatte ja praktisch überhaupt gar keinen Infor- 
mationsgehalt für mich, [..] ist sogar, äh, ein Gespräch zwi also, 
also so eine Art Smalltalk zwischen den Moderatoren gewesen, was 
mich bei, äh, beim Radio, wenn sie dann auch noch anfangen zu ki- 
chern und so, sehr stört. 


Auszug 10 (Figaro Int. 3, Abs. 170) 


Während die Sputnik-Hörer*innen es wertschätzen, wenn Moderationen infor- 
mellen Alltagsgesprächen nahekommen, scheint „Smalltalk“ in dieser Untersu- 
chungsgruppe eher negativ besetzt zu sein: 


F13: [..] Und, äh, Vortragsweise flapsig, eher umgangssprachlich, 
als würde ich mich mit jemandem, äh, von Angesicht zu Angesicht un- 
terhalten. Über irgendwas, was eher belanglos ist. Ähm, wieder po- 
pulistisch. Populistisch und ich würde sagen, das ist so ein, so 
ein, hat so ein Niveau von Smalltalk. 


Auszug 11 (Figaro Int. 7, Abs. 94) 


In der Praxisliteratur zu Radiomoderation wird oft selbstverständlich davon aus- 
gegangen, vor allem jüngere Hörer*innen lehnten den formelleren Duktus von 
Kulturprogrammen grundsätzlich ab (vgl. z. B. Brünjes / Wenger 1998, 96; Buch- 
holz 2012). In der Tat hört das deutsche Radiopublikum mehrheitlich populäre 
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Begleitprogramme wie MDR Sputnik und nur eine Minderheit schaltet regelmä- 
Big Kultursender ein (vgl. Lüthje 2010; Eckert / Feuerstein 2015). Daher ist zu 
vermuten, dass die meisten Radionutzer und -nutzerinnen auf gesprächshaft wir- 
kende Moderationen eher wie die Befragten aus dem Sputnik-Sample reagieren 
dürften. Nichtsdestoweniger zeigen die erhobenen Daten, dass es auch unter jün- 
geren Hörer*innen offenbar Gruppen mit anderen Präferenzen gibt. 

Interessanterweise deuten beide deutschen Hörergruppen den Inhalt der Mode- 
ration als belangloses Unterhaltungsthema. Ein Sputnik-Hörer spekuliert bei- 
spielsweise, es gehe darin um „die aktuellen Ereignisse aus dem Dschungelcamp“ 
(Sputnik Int. 8, 114), eine TV-Sendung, die regelmäßig mit Begriffen wie „Un- 
terschichtenfernsehen“ in Verbindung gebracht wird (vgl. z. B. Backovic 2014). 
Es ist in dem Ausschnitt nicht ersichtlich, aber das Morningshow-Team spricht 
hier von einer Werbeaktion des Ministerpräsidenten von Sachsen-Anhalt, mit der 
er nach Baden-Württemberg gezogene Bürger und Bürgerinnen seines Bundes- 
landes wieder zurückgewinnen wollte — also ein durchaus politisches Thema. Die 
Reaktionen auf diesen Stimulus zeigen, wie eng Moderationsstile auch mit typi- 
schen Inhalten assoziiert sind (vgl. Goodman 1978, 24 ff.; Bakhtin 1986). Wäh- 
rend die Kulturradiohörer*innen auch in anderen Interviewpassagen ihre Ableh- 
nung gegenüber „so Klatsch Boulevard“ betonen (Figaro Int. 2, Abs. 77), 
präferieren die Hörer*innen des Jugendradios, „eher etwas Unbeschwertes [zu] 
hören“ über „Themen, die jetzt nicht extrem wichtig sind“ (Sputnik Int. 10, Abs. 
256-259). Da sie Radio meist nebenbei hören, während sie anderen Tätigkeiten 
nachgehen, würden sie ansonsten „einfach komplett abgelenkt von den Sachen, 
die man eigentlich zu tun hat“, außerdem eigneten sich solche Themen auch bes- 
ser, um etwa radiohörend in der Badewanne zu entspannen (ebd.). 

Im Gegensatz zur Sputnik-Gruppe machen die Interviewten in der Figaro- 
Gruppe deutlich, dass sie den emotionalen Ausdruck in der Beispielmoderation 
unangemessen finden. Teilweise wird das so begründet wie im Auszug 8, wonach 
sich der Moderator und die Moderatorin nicht „zusammennehmen‘“ können und 
demzufolge offenbar echte Emotionen äußern. Noch häufiger wird ihr emotiona- 
ler Ausdruck aber als unauthentisch empfunden. Auch in diesem Zusammenhang 
fällt insbesondere das Lachen von Moderatorin WB auf: 


F07: Was ich auch als unangenehm empfunden hab, war im ersten 
Beispiel das Lachen. Und das ist mir bei andern Beispielen manchmal 
aufgefallen, wenn die dann so, so lachen. Und das hört sich für 
mich auch immer bisschen unnatürlich an, wenn die so zu zweit reden 
und dann immer so. Ich glaub, da gibt's auch ganz schlimme Lachen 
von Radiomoderatoren, die sich dann für mich sofort ins Aus. 
Irgendwie, die dann zwar vielleicht charakteristisch sind, aber 
irgendwie unangenehm in dem Moment. [..] 
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F08: Vielleicht einfach auch wieder weil's, äh, so laut ist. Also 
ich meine, klar ist es, es gibt halt diese, ich, ja, lach ja auch 
laut und schallend, aber nicht immer. Und ich hab irgendwie das Ge- 
fühl, dass das dann irgendwie immer ist, ich muss immer besonders 
laut lachen über irgend nen Witz, der dann vielleicht auch mal 
grade nicht komisch ist. 


Auszug 12 (Figaro Int. 4, Abs. 335-345) 


Unauthentische Emotionen gelten mitunter als formattypisch. Eine Hörerin 
nimmt die Sputnik-Moderation zum Anlass, sich allgemein zu „Mainstreamsen- 
dern“ zu äußern: 


F06: [..] Also, ähm, kann man ja immer sehen, wie man will. Also 
mal, also, ich hör ja auch durchaus, wenn ich bei meinen Eltern 
bin, mal Radio, die solche Mainstreamsender hören. Da ist das 
manchmal schon ganz nett, wenn irgendwie man morgens um sechs auf- 
stehen muss und dann irgendwie gleich gute Laune kriegt, aber ir- 
gendwie, das ist ja meistens immer nur so ein Bruchteil, ja. Da 
wird man ja zugespammt mit irgendwelchem, mit irgendwelchem Wer- 
bungsmist, ja. Und, ähm, diese gekünstelte Fröhlichkeit, das ist ja 
immer fröhlich, ja. Also es gibt ja meistens keine, keine anderen 
emotionalen Zustände außer irgendwie Moderatoren auf Sekt und 
Speed, ja, irgendwie. Keine Ahnung, also, die sind ja permanent 
überglücklich. 


Auszug 13 (Figaro Int. 3, Abs. 172) 


3.3 Reaktionen der kanadischen Hörerinnen und Hörer 


In den Beschreibungen der kanadischen Befragten fallen zunächst sehr viele Pa- 
rallelen zu den Beschreibungen der Hörer*innen von Sputnik auf. Beispielsweise 
deuten auch hier mehrere Interviewte das Lachen als einen Hinweis, dass frei und 
spontan formuliert wurde: 


K14: Ich fand die erste und dritte sehr, wie du sagtest, mehr Pop- 
sendung und ich habe das so gesehen mit dem mehr Freisprachlichen, 
mit dem Lachen und ich dachte, es wäre mehr so original, so, nicht 
gelesen, [..] frei gesprochen. 


Auszug 14 (Kanada Int. 7, Abs. 31) 


K12: [..] ja der dritte war, man könnte die, also, sie hat gelacht 
und das Lachen konnte man die ganze Zeit in der Stimme hören. Und 
das mag ich eigentlich, wenn sie sich unterhalten und man kann die 
Gefühle und die, ähm, facial expressions auch hören. [...] 


K11: Dann klingt das auch viel natürlicher und nicht so gezwungen, 
irgendwie. Ich bin nicht wirklich sicher, wie man das so natürlich 
machen kann, aber ich glaube, das ist ein guter Weg, wenn man das 
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so hören kann. Und dann fühlt man, als ob der Moderator das, äh, so 
eigentlich fühlt und das nicht nur macht für die Sendung oder so. 


Auszug 15 (Kanada Int. 6, Abs. 121-122) 


Die Präsentationsweise wird als angemessen und authentisch wahrgenommen. 
Das Lachen wird dabei als emotionaler Ausdruck erlebt, der Nähe und Sympathie 
erzeugt. Wie in der Sputnik-Gruppe beschreiben die Interviewten das Gespro- 
chene als nicht „gezwungen“, als frei von äußeren „Richtlinien“ (siehe Auszug 8). 
Die Moderatorin lacht nicht „für die Sendung“, weil sie es muss oder um beim 
Publikum einen kalkulierten Effekt zu erzielen, sondern sie „fühlt“ es tatsächlich 
(siehe auch Auszug 3 und — im Gegensatz dazu — Auszug 12). Das Morningshow- 
Team wirkt auf die Befragten glaubwürdig, sie fühlen sich angesprochen und in 
das Gespräch miteinbezogen: 


K09: [..] man hat auch gemerkt, dass die Frau zum Beispiel gelacht 
hat und so. Es ist dann mehr, ähm ja, ich denke, das ist dann nicht 
wie so eine Präsentation, wo jetzt vielleicht, würde ich sagen, 
jüngere Leute gelangweilt wären, was erzählt der Alte mir da. Und 
hier gibt es dann einen Diskurs zwischen zwei Personen und das 
wirkt dann wahrscheinlich auch anziehender und, ähm, also der Zuhö- 
rer wird mehr miteinbezogen. 


Auszug 16 (Kanada Int. 5, Abs. 53) 


Ähnlich wie den deutschen Jugendradiohörer*innen fällt den kanadischen Inter- 
viewten die — aus ihrer Sicht — für Radiomoderation eher untypische Stimmge- 
bung von WB auf. Im Einklang mit einer insgesamt positiven Bewertung wird das 
nicht als Makel (wie in der Kulturradio-Gruppe), sondern gerade dadurch als be- 
sonders attraktiv bewertet: 


K06: Ich denke, manchmal ist es interessanter für mich, wenn die 
Stimmung einmalig ist, like unique. Und deswegen, bei der ersten 
fand ich das attraktiver, weil die Frau eine einmalige Stimme 
hatte. 


I: Eine individuelle Stimme. 


K06: Ja. Und, ähm, sie haben Spaß gemacht und das würde ich, ähm, 
anhören. 


Auszug 17 (Kanada Int. 3, Abs. 178) 


Probandin K06 verweist mit „sie haben Spaß gemacht“ auf den Unterhaltungs- 
wert der Moderation. Häufig bewerten die kanadischen Hörer*innen eine Mode- 
ration als gelungen, wenn sie sich unterhalten („entertained“) fühlen (siehe Aus- 
zug 19). Ein unterhaltender Moderationsstil wird mit einer insgesamt lockeren, 
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natürlichen und dynamischen Präsentationsweise in Verbindung gebracht. Wie 
die Befragten aus dem deutschen Jugendradio-Sample grenzen sie diese von Mo- 
derationsstilen ab, die hörbar „abgelesen“ klingen — eine Beschreibung, mit der 
sie in der Regel Moderationen von Infosendern (Auszug 18) und Kulturformaten 
(Auszug 19) charakterisieren. Auch hier gibt es deutliche Parallelen zu den Be- 
schreibungen der Sputnik-Hörer*innen: 


K10: Das letzte sticht hervor. Mit dem genau, es waren vorher ja 
auch schon ein oder zwei, ähm, Mitschnitte, in denen zwei Personen 
in diesem Dialog waren oder in denen zwei Moderatoren quasi sich 


I: Unterhalten. 


K10: unterhalten haben, ja. Genau, und dadurch hob sich das natürlich 
auch hervor, dadurch hatte es noch mehr natürlicheren Klang. Ähm, 
also den Klang einer natürlichen Konversation im Kontrast zu dem 
Nachrichtensprecher, der quasi vom Papier mit den Kommas abliest. 


Auszug 18 (Kanada Int. 5, Abs. 53) 


Was Proband K02 im Auszug 19 genau darunter versteht, wenn ein Sprecher sei- 
ner Ansicht nach „schlecht abliest“, kann hier nur vermutet werden. In der Gruppe 
der Sputnik-Hörer*innen finden sich allerdings viele Hinweise, dass zu diesem 
Eindruck eine Sprechweise beiträgt mit zahlreichen, aber zugleich wenig hervor- 
gehobenen Akzenten, stereotypen melodischen Mustern sowie nicht sinngerecht 
gesetzten Akzentuierungen und Pausen (vgl. Böhme 2015 sowie 2019, 133 ff.). 
Dabei handelt es sich um ein Sprechmuster, das in den Massenmedien als durch- 
aus verbreitet gilt und beispielsweise auch in Hörfunknachrichten vorkommt (vgl. 
Apel 2018). 


K02: Ja, man hört Ra, Also ich höre Radio, um entertained zu sein. 
I: Unterhalten zu sein, ja. 


K02: Ja, und nicht, um irgendetwas Neues zu lernen vielleicht und 
also das dritte war fast wie ein Textbuch für mich. 


K0l: Ja. (I lacht) 


K02: Fast so interessant (lacht). 


I: Fandst du das dann, also hast du den Unterschied auch daran 
vielleicht festmachen können, dass du dir gedacht hast, der dritte 
liest ab, die anderen sprechen frei? Fandst du das abgelesen? 
Fandst du, das klang wie abgelesen, weil du sagst Textbuch? 


K02: Nicht ganz, ja, vielleicht schon. Die ersten zwei waren 
bestimmt freier, die waren witziger, aber es ist mir eigentlich 
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egal im Radio, ob einer etwas abliest, wenn er es gut macht, weißt 
du? 


I: Ok. Mmh. Aja. 


K02: Aber man merkt schon, wenn einer etwas schlecht abliest. Und 
dann will man auch nicht zuhören. 


Auszug 19 (Kanada Int. 5, Abs. 53) 


Eine Probandin weicht in den kanadischen Interviews hinsichtlich ihrer Pro- 
grammpräferenzen von nahezu allen übrigen Teilnehmenden ab. Sie gibt an, re- 
gelmäßig NPR (National Public Radio) zu hören. Hierbei handelt es sich um einen 
Zusammenschluss nicht-kommerzieller Sender in den USA mit einer relativ aka- 
demisch geprägten Zielgruppe (vgl. National Public Media 2018). Die Beschrei- 
bungen der Probandin ähneln eher denen der Figaro-Hörer*innen. Im Auszug 20 
geht sie besonders auf stimmlich-artikulatorische Merkmale der Beispielmodera- 
tion ein, die ihrer Auffassung nach eindeutig Rückschlüsse auf eine unterhal- 
tungsbetonte Moderation für jüngere Leute zulassen. Sie sagt nicht direkt, dass 
sie die Beispielmoderation „dumm“ findet, aber sie fühlt sich dadurch an eine 
Sendung erinnert, die sie so bewertet: 


K07: [..] Also dann kann ich damit, äh, ich kann es verstehen und 
dann ist es sehr klar, dass sie eine Meinung haben und, äh, also, 
dass es nicht Fakten sind und auch, also ja, nur anhand des Tons 
konnte ich sehen, dass es für sie interessant ist, es könnte auch 
etwas Persönliches sein. Also ja, dann weiß ich, dass es vielleicht 
eine Talkshow ist [..]. Aber [..] wahrscheinlich sind die erste und 
dritte eher für jüngere Leute, aber auf mich trifft es nicht zu, 
weil ich hatte in Atlanta eine Sendung gehört und das war nicht 
wirklich für junge Leute, aber ich fand sie alle wirklich sehr dumm 
und sie sprachen so wie der erste und dritte. Also es war nicht 
wirklich jung, aber fand ich ziemlich doof. (K08 lacht) Das könnte 
ich nicht anhören (lacht). [..] Persönlich möchte ich mit Musik füh- 
len, aber, wenn jemand spricht, möchte ich wichtige oder interes- 
sante Informationen kriegen. Ich möchte nicht nur Leute quatschen 
hören (lacht). 


Auszug 20 (Kanada Int. 5, Abs. 53) 


Obgleich sie (wie auch Proband K09 im Auszug 16) eine junge Zielgruppe ver- 
mutet, der sie im Prinzip selbst angehört, nimmt sie das Gesprächs- und Identifi- 
kationsangebot des Morningshow-Teams für sich nicht an. Das emotionale Ein- 
bezogen-Werden, das die Sputnik-Hörer*innen sowie die übrigen kanadischen 
Interviewten an der Moderation besonders positiv bewerten, ist für sie eher eine 
Funktion von Musik, nicht aber von Radiomoderation. Moderator*innen „nur 
[...] guatschen“ zu hören genügt ihr offenbar nicht, ähnlich wie bei Figaro-Hörer 
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F03 („mir bringt das jetzt nicht wahnsinnig viel“, siehe Auszug 8). Sie erwartet 
stattdessen „wichtige oder interessante Informationen“, ein Bedürfnis, das sie bei 
dieser Art von Moderation offenbar nicht erfüllt sieht — es ist wahrscheinlich, dass 
auch Probandin K07 annimmt, es gehe in dem Ausschnitt um ein eher „belang- 
los[es]“ Thema. Eine Bewertung wie „die fand ich ziemlich doof“ rückt sie wie- 
derum in die Nähe von Proband F13, der der Moderation ein „Niveau von Small- 
talk“ zuschreibt (siehe Auszug 11). Ihr Gesprächspartner K08, der eher 
Begleitprogramme bevorzugt, positioniert sich selbst zu ihrer Geschmacksbekun- 
dung im Auszug 20 mit: „Du bist einfach kultivierter als ich“, woraufhin sie ihm 
zustimmt und alle Beteiligten lachen (Kanada Int. 4, Abs. 58). Hier könnte man 
Bezüge zu einem Bild vermuten, das auch deutsche Jugendradiohörer*innen von 
Menschen haben, die gern Kulturprogramme hören: „So Klassik-Menschen, kul- 
turinteressierte Menschen, die dann nicht Pop hören möchten oder Rock, |[...] 
welche, zum Beispiel, die Instrumente spielen, die selber so mit klassischer Musik 
aufwachsen“ (Sputnik Int. 6, Abs. 145-149). Moderator*innen von MDR Figaro 
werden in der Sputnik-Gruppe häufig sehr plastisch als eine Art stereotype Bil- 
dungsbürger beschrieben (sie klingen wie Professoren, lieben politische Diskus- 
sionen, trinken gern Wein, tragen Brille und Anzug bzw. Kostüm) und auch die 
Zielgruppe, die sie diesem Sender zuschreiben, scheint solchen Vorstellungen zu 
entsprechen. Obgleich die Sputnik-Gruppe fast ausschließlich aus angehenden 
Akademikerinnen und Akademikern besteht, kann sich dort die Mehrheit (noch) 
nicht mit diesem Bild identifizieren (vgl. Böhme 2016 sowie 2019, 106 ff., 
152 ff.). 


4 Fazit und Ausblick 


Insgesamt lässt sich festhalten, dass die kanadischen Interviewten kaum Probleme 
hatten, die verschiedenen Stimuli, zu denen sie befragt wurden, Radioformaten 
und Zielgruppen zuzuordnen — sehr häufig entsprachen ihre Angaben dabei den 
Angaben der Sender selbst, obwohl sie weder mit den beteiligten Programmen 
vertraut noch in Deutschland sozialisiert waren. Deutsche Radioformate scheinen 
also durchaus über die regionalen Grenzen hinweg wiedererkennbar zu sein. Wie 
erste Ergebnisse einer explorativen Untersuchung mit dänischen Radiohörer*in- 
nen zeigen, funktioniert dies sogar dann, wenn die Befragten kein Deutsch spre- 
chen und die deutschsprachigen Moderationen nicht verstehen (vgl. Böhme 
2015). Dies spricht zum einen dafür, dass es in der — insbesondere klanglichen — 
Gestaltung wie auch in der Rezeption des stark internationalisierten Mediums Ra- 


© Frank & Timme Verlag für wissenschaftliche Literatur 61 


dio einige ähnliche Muster zu geben scheint, zumindest im mittel-, nordeuropäi- 
schen und nordamerikanischen Kontext. Zum anderen liegt angesichts jener Ähn- 
lichkeit die Vermutung nahe, dass einige dieser Tendenzen sich auch bei der Re- 
zeption anderer Medien finden lassen, in denen gesprochene Sprache und die 
Herausbildung von Markenidentitäten eine Rolle spielen. 

Nach dem bisherigen Stand der Analyse haben sich Hörgewohnheiten und 
Programmvorlieben als die besten Indikatoren dafür herauskristallisiert, in 
welcher Weise die Hörer*innen Moderationsstile beschreiben, einordnen und 
bewerten. Sie eignen sich möglicherweise sogar besser als die Herkunft bzw. das 
Land, in dem die Beschreibenden jeweils aufgewachsen sind und leben, oder als 
die (Erst-)Sprache, die sie sprechen. Hinsichtlich des Alters und des Bildungs- 
grads waren, wie bereits erwähnt, alle befragten Hörergruppen miteinander 
vergleichbar. 

Diese Hörgewohnheiten und Programmvorlieben scheinen wiederum mit wei- 
teren Faktoren zusammenzuhängen. Zunächst wird aus den Ausführungen der In- 
terviewten deutlich, dass Hörer*innen von populären Begleitprogrammen offen- 
bar andere Bedürfnisse und Erwartungen an eine Radiomoderation richten als 
diejenigen, die Kulturformate bevorzugen. Die Begleitprogrammhörer*innen be- 
trachten Radio eher nicht als Informationsmedium. Suchen sie nach Informatio- 
nen oder intellektueller Anregung, nutzen sie andere Medien. Stattdessen schalten 
sie das Radio ein, um unterhalten zu werden und um damit eine angenehme At- 
mosphäre, gute Laune zu verbreiten, während sie gleichzeitig meist anderen Tä- 
tigkeiten nachgehen, die ihre Aufmerksamkeit mehr oder weniger stark beanspru- 
chen (vgl. Böhme 2019, 102 ff., 256 ff.). Begleitprogramme sind in ihrer 
Gestaltung genau für solch eine eher stimmungsbetonte Nutzungsweise (sog. 
Mood Management) optimiert. Einschaltprogramme wie Kultur- und Informa- 
tionsformate sind dagegen stärker auf die Bedürfnisse sog. „instrumenteller Nut- 
zer“ zugeschnitten, die vom Radio Informationen sowie „Stoff zum Nachdenken“ 
erwarten und das Programm tendenziell aufmerksamer verfolgen (vgl. 
Vowe / Wolling 2004, 86 f.; Stümpert / Buchholz 2013; Benecke 2013) — also 
das, was z. B. Probandin K07 im letzten Auszug zu erwarten scheint. Ganz im 
Sinne des Nutzen- und Belohnungsansatzes (vgl. Schenk 2007, 681 ff.) kann man 
daher die jeweilige Programmwahl als bewusste Bedürfnisbefriedigung betrach- 
ten. Vor diesem Hintergrund erscheint es sinnvoll, wenn die Befragten Moderati- 
onsstile im Hinblick auf genau diese Bedürfnisse einteilen und bewerten. 

Es deuten sich aber noch weitere Einflüsse an, die mehr damit zu tun haben, 
wie sich die Interviewten selbst verorten. So haben sich bei einem Vergleich zwi- 
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schen Sputnik- und Figaro-Hörer*innen Hinweise verdichtet, dass sich ihr Um- 
gang mit den Identifikationsangeboten der Moderator*innen auch dadurch be- 
stimmt, ob sie sich selbst als „jugendlich“ oder „erwachsen“ sehen — unabhängig 
vom numerischen Alter (vgl. Böhme 2016). Auch scheint es bei Kulturradio-affi- 
nen Befragten eine gewisse Tendenz zu geben, sich vom „Mainstream“ abgrenzen 
zu wollen, während die Hörer*innen von Begleitprogrammen sich gerade mit sol- 
chen Moderator*innen identifizieren können, die sprechen „wie die Leute auf der 
Straße“ (Sputnik Int. 8, Abs. 183; vgl. auch Böhme 2019, 185 ff.). All dies scheint 
sich wiederum darauf auszuwirken, welche Moderationen jeweils als authentisch, 
als „natürlich“ oder „unnatürlich“ wahrgenommen werden. Auf Grundlage der 
kleinen Probandenzahl lassen sich hier noch keine generalisierten Aussagen tref- 
fen. Das Ausmaß der Überschneidungen zwischen Interviewten mit ähnlichen 
Programmvorlieben über Ländergrenzen hinweg ist allerdings bemerkenswert 
und bietet Anlass zu weiteren Untersuchungen (vgl. auch Böhme 2015). 

Während der Analyse der vorliegenden Daten kam noch eine weitere Frage auf: 
Die bereits erwähnte Untersuchung zur Gestaltung von Moringshows im 
deutschsprachigen Radio (vgl. Bose / Finke 2016, 86; Finke 2019) hatte ergeben, 
dass geräuschhafte, „pathologisch-angestrengt[e]‘“ Stimmen in Begleitprogram- 
men heutzutage keine Seltenheit sind. Warum wird die Stimme der Moderatorin 
WB aber in allen drei Befragtengruppen, auch den deutschen, als „untypisch“ 
wahrgenommen? Eine mögliche Antwort darauf könnte sein, dass das alte Stimm- 
ideal der hörbar professionell geschulten Sprecher*innen nach wie vor bei vielen 
Hörer*innen präsent ist und WBs Stimme erst durch den Kontrast zu dieser Norm 
ihre Wirkung entfaltet. Für diese Interpretation würde z. B. die Aussage von Pro- 
bandin S22 im Auszug 1 sprechen, die die Sprechweise der Moderatorin von „ge- 
leckt“ wirkenden Sprechweisen abgrenzt. 

Eine weitere Möglichkeit könnte aber auch ein Bruch mit — in Radiomoderati- 
onen oft fortgeschriebenen — Genderklischees sein (vgl. Galonski / Finke in die- 
sem Band). In Doppelmoderationen spielen Moderatorinnen häufig die Rolle des 
Sidekicks, der den wesentlich dominanteren und fast immer männlichen Anchor 
bestätigt und unterstützt. Die Sidekick Rolle wird u. a. auch durch den Einsatz der 
Stimme getragen, oft geht sie einher mit einer mittleren bis hohen Sprechstimm- 
lage, zum Teil behaucht, kombiniert mit viel Lachen und lächelndem Sprechen 
(vgl. Finke 2019, 251 ff.). Rauigkeit scheint bei Moderatorinnen dagegen eher 
weniger verbreitet zu sein und wird in den Interviewpassagen zu WB auch häufig 
erwähnt. Ebenso könnte ihre tiefe mittlere Sprechstimmlage zum Eindruck des 
Untypischen beitragen, wenngleich diese dem klassischen Stimmideal der tiefen 
Radiostimme entsprechen würde. In den Interviews mit den Sputnik-Hörer*innen 
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werden Sprecherinnen von Infoformaten teilweise als unangenehm empfunden, 
weil eine „sehr, äh, tiefe Frauenstimme und dadurch so eine, ähm, so eine domi- 
nante Stimme“ zu „Berührungsängsten“ führt (Sputnik Int. 10, Abs. 159-167) 
bzw. „die Stimme war, war mir für eine Frau auch irgendwie zu tief oder nicht, 
nicht so sanft. Sie klang jedenfalls nicht so schön“ (Sputnik Int. 1, Abs. 248). Die 
laute, raue und gespannte Phonationsweise der Moderatorin WB dürfte aller 
Wahrscheinlichkeit nach von vielen Rezipientinnen und Rezipienten ebenfalls als 
nicht allzu „sanft“ wahrgenommen werden. Dennoch wird sie von denjenigen In- 
terviewten, die Begleitprogramme bevorzugen, durchgehend positiv bewertet 
(wenngleich z.T. erst nach einer „Eingewöhnungsphase“, siehe Auszug 1). Even- 
tuell tragen ihre umgangssprachlichen Formulierungen, die vielen Reduktionen in 
unbetonten Silben sowie insbesondere ihr Lachen und die Smile Voice dazu bei, 
dass „Berührungsängste‘“ abgebaut werden. Vermutlich lassen sich die Reaktio- 
nen der Hörer*innen hier — wie bei Sprechstilen häufig der Fall — nicht auf ein- 
zelne Merkmale, sondern nur auf Merkmalskombinationen zurückführen (vgl. E- 
ckert 2008; Bose 2010). Auch hier eröffnet sich ein Feld für weitere 
Untersuchungen. 
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„die MORgenMAÄdels“ 
Untersuchung zu Gender-Konstruktionen 
in Radio-Morningshows 


Jasmin Galonski, Halle (Saale) / Clara Luise Finke, Leipzig 


In diesem Beitrag werden Gender-Konstruktionen in Radio-Morningshows unter- 
sucht. In dieser meistgehörten und prestigereichen Sendestrecke sind meist Mo- 
deratorenteams mit zwei (oder mehr) Personen im Einsatz; es finden also Mehr- 
fach-Moderationen statt — häufig in der Kombination Mann-Frau. Gleichzeitig ist 
eine vornehmlich männliche Besetzungspolitik festzustellen, in der sich zudem 
eine Inszenierung stereotyper Geschlechterrollenbilder abzeichnet. Anhand einer 
Stichprobe von zwanzig Sendern werden Relevanz und interaktive Konstrukti- 
onsmechanismen von Geschlecht in Doppel-Moderationen offengelegt und es 
wird nachgewiesen, inwiefern genderisierte Differenzarbeit ein wichtiges stilisti- 
sches Mittel der Mehrfach-Moderationen darstellt. Außerdem wird differenzie- 
rend herausgearbeitet, wie sich hierarchische oder gleichberechtigt angelegte 
Funktionsrollen (Anchor vs. Sidekick oder Anchor vs. Anchor) innerhalb der Mo- 
deratorenteams auf die Konstruktion von Geschlechterrollenbildern auswirken. 


1 _ Geschlechterpositionierung in der Radio-Primetime 


Die Morningshow ist die meistgehörte, bestbezahlte und prestigereichste Sende- 
strecke im Radio. Daher wird sie auch als Radio-Primetime bezeichnet. Morni- 
ngshow-Moderator*innen werden wie Stars inszeniert, buhlen insbesondere 
durch ihre „Personality“ (vgl. Finke 2019, 42-48) um die Gunst der Hörenden 
und werden zu Bezugspersonen für diese. Eine Vielzahl der Radiosender setzt für 
diese wichtige Sendestrecke zwei (oder mehr) Personen ein, die im Team in so- 
genannten Mehrfach-Moderationen durch die Sendung leiten — häufig in der 
Kombination Mann-Frau. Dabei scheint in der Gestaltung der Interaktion die In- 
szenierung von Unterschieden zwischen den Moderierenden eine starke Rolle zu 
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spielen — dieser Inszenierungsprozess wird im Folgenden als Differenzarbeit be- 
zeichnet (vgl. Kotthoff 2003, 133 und Finke 2019, 276). 

Es ist davon auszugehen, dass die in der Morningshow inszenierten Gespräche 
eine stark normative und identitätsstiftende Wirkkraft haben. Problematisch wird 
dies, wenn Geschlecht in stereotyper Weise inszeniert wird, wie dieser Jingle zum 
Auftakt einer Morgenmoderation mit drei Moderierenden illustriert (Transkrip- 
tion orientiert an GAT?2, Selting et al. 2009; die Siglen in allen Transkripten ste- 
hen für: EV = vorproduzierte Elemente wie z. B. Jingles, Musikbett, Songs, M1 
+ M2 = Moderator*innen pro Sender). Die Audios zu den im Beitrag behandelten 
Beispielen (Transkripten) sind verfügbar über den QR-Code zu Beginn des Arti- 
kels bzw. unter: https://cloud.uni-halle.de/s/epjwjeNyar4fmWy. 


001 EV: <<gesungen>ANdre und die 1460.000 
MORgenMÄdels- ||> 

002 <<männl, deklarierend>e:s i::st !FREI!tag 
MORgen- | 

003 und HIER (.) ist IHR !GAST!geber- | 

004 Andre: HARDT. ||> 1465.000 


Transkript 1: „Morgenmädels“ (Sender El; Audio 1) 


Während der Moderator mit vollem Namen als Gastgeber (sogenannter Anchor- 
Moderator) angekündigt wird, werden die beiden Co-Moderatorinnen hier als 
anonyme „Morgenmädels“ zusammengefasst und durch die Wortwahl vernied- 
licht. Der Moderator wird dadurch als ein kompetent handelndes Subjekt einge- 
führt, die Moderatorinnen hingegen bleiben namenlos und werden auf ihre Funk- 
tion als „schmückendes Beiwerk“ des Anchor-Moderators reduziert. Dass das hier 
gezeigte Beispiel als paradigmatisch gelten kann, belegt auch Geissner (2005) in 
einer Untersuchung von geschlechtsspezifischen Einsatzbedingungen von Mode- 
rator*innen im Hörfunk. Seine Untersuchung zeigt, dass Frauen insbesondere in 
der Radio-Primetime unterrepräsentiert sind. Obgleich das Zahlenverhältnis der 
Mitarbeiter*innen beim Hörfunk zwischen den Geschlechtern insgesamt ausge- 
glichen ist, ist die Radio-Primetime überwiegend mit Männern besetzt (vgl. ebd., 
219). Frauen treten in den Morgensendungen vornehmlich als Sidekick oder Co- 
Moderatorinnen auf, wodurch ihnen nur ein eingegrenzter Sprechanteil und eine 
limitierte inhaltliche Bedeutung innerhalb der Sendung zukommt (ebd.; vgl. au- 
Berdem Finke 2019, 261-262). Diese Besetzungspolitik in Radio-Morningshows 
legt nahe, dass Geschlecht ein relevanter Faktor in den Moderationsgesprächen 
ist. 
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2  Forschungsziele 


Im Folgenden werden zwei aufeinander aufbauende Untersuchungen zu Gender- 
Konstruktionen in Radio-Morningshows vorgestellt und verknüpft (Galonski 
2017 und Finke 2019), mit dem Ziel, die interaktiven Konstruktionsmechanismen 
von Geschlecht in Mehrfach-Moderationen offenzulegen. Forschungsleitende 
Frage war hierbei, welche Relevanz Geschlecht in Moderationsgesprächen zu- 
kommt, inwiefern die Moderierenden tradierte Geschlechterrollen aufbauen, 
durchbrechen oder indifferent handhaben. Dabei wurde differenzierend herausge- 
arbeitet, wie sich hierarchische oder gleichberechtigt angelegte Funktionsrollen 
(Anchor vs. Sidekick oder Anchor vs. Anchor) innerhalb der Moderatorenteams 
auf die Konstruktion von Geschlechterrollenbildern auswirken. Abschließend 
wurde bewertet, welche Bilder von „Männlichkeit“ und „Weiblichkeit“ in der Ra- 
dio-Primetime gezeichnet werden. Dabei wurde der ethnomethodologische An- 
satz zugrunde gelegt, dass geschlechtliche Identität nicht biologisch vorgegeben 
ist, sondern durch verbale und nonverbale Handlungen auf der Basis von sozio- 
kulturell verankerten Vorstellungen von „Männlichkeit“ und „Weiblichkeit“ kon- 
textbezogen erzeugt wird (vgl. Garfinkel / Sacks 1976; Samel 2000, 148; Günth- 
ner 2006, 26). 


3 Gender-Konstruktion in Interaktion 


3.1 Definition: Der Gender-Begriff 


„Geschlecht“ ist im Deutschen ein recht eindimensional belegter Begriff für ein 
Phänomen mit vielen Facetten. Die wissenschaftsfähige Unterscheidung zwi- 
schen Sex und Gender hat ihren Ursprung in den USA, wo sie im Zuge der femi- 
nistischen Bewegung in den 1970er Jahren Einzug in die Forschungslandschaft 
hielt (vgl. Stephan 2000, 58). Der englische Begriff Sex referiert auf das „körper- 
liche Geschlecht“ einer Person und erfasst damit die „Anatomie, Physiologie, 
Morphologie, Hormone und Chromosomen eines Menschen“ (Aulenbacher et al. 
2010, 61). Der Terminus Gender zielt hingegen auf das soziale Geschlecht im 
Sinne einer sozialen und kulturellen Prägung, welche Verhaltensweisen hervor- 
bringt, die als typisch „männlich“ oder typisch „weiblich“ gelten (vgl. ebd.). Diese 
Differenzierung stellt eines der grundlegendsten Paradigmen der Geschlechter- 
forschung dar, in dessen Rahmen es nunmehr möglich war, die kulturelle Kon- 
struiertheit von Geschlecht in den Fokus zu nehmen: 
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„Die sex-gender Trennung erlaubte es, Geschlechterdifferenzen und -unterschei- 
dungen nicht einfach als biologisches, außergesellschaftliches und unveränderbares 
Los zu begreifen. Der Einfluss des körperlichen Geschlechts (sex) auf die benach- 
teiligte Stellung von Frauen in Wissenschaft, Politik oder Wirtschaft konnte mit 
dieser Unterscheidung zurückgewiesen werden. Damit trat die Geschlechterfor- 
schung der in Gesellschaften weit verbreiteten, tief verankerten und schwer erschüt- 
terbaren Argumentation entgegen, dass die gesellschaftliche Benachteiligung von 
Frauen aus ihrer natürlichen Wesensbeschreibung resultiere“ (ebd.). 


Insbesondere über das Verhältnis von biologischem und sozialem Geschlecht 
scheiden sich innerhalb der Forschungslandschaft die Geister, sodass sich bis 
heute kein Konsens darüber etabliert hat, was Gender im Einzelfall bedeutet (vgl. 
Stephan 2000, 58; eine Gegenüberstellung von Goffmans Betrachtung der Sex- 
Gender-Dichotomie mit der von Butler findet sich beispielsweise bei Kotthoff 
1994, 163). Gleichwohl ist der Gender-Begriff in der internationalen Wissen- 
schaftswelt mittlerweile allgegenwärtig und löste auch im deutschsprachigen 
Raum den eindimensionalen Begriff „Geschlecht“ ab, welcher „eine Entkoppe- 
lung von Geschlecht und Geschlechterdifferenzen mit Natur und Biologie“ nicht 
abbilden kann (vgl. Stephan 2000, 58; Aulenbacher et al. 2010, 61). Gemein ist 
aktuellen Ansätzen der Geschlechterforschung die Annahme der Konstruiertheit 
von Geschlechtsidentität, auf deren Basis sich verschiedene Ansätze zur Beschrei- 
bung geschlechtlicher Konstruktionsprozesse ausbildeten, so etwa die Konzepte 
des „Doing Gender“ (Goffman 1994; West / Zimmermann 1987), „Undoing Gen- 
der“ (Hirschauer 2001) und „Indexing Gender“ (Ochs 1992). An dieser Stelle sei 
der Vollständigkeit halber auch das poststrukturalistische Konzept des „Perfor- 
ming Gender“ erwähnt, welches auf Judith Butler (1991) zurückgeht (mehr dazu 
bei Spieß 2012, 56-59). 

Im Folgenden wird der Begriff „Geschlecht“ synonym zu Gender, nicht im 
Sinne körperlicher Merkmale, sondern einer sozial konstruierten Geschlechtsi- 
dentität verwendet. Die Zuschreibungen „weiblich“ und „männlich“ werden im 
Folgenden in Anführungszeichen gesetzt, um ihre soziale Konstruiertheit zu un- 
terstreichen sowie um biologistisch begründete Lesarten auszuschließen. Über- 
dies wird durch die Nutzung des Gender-Gap in Form eines * anerkannt, dass es 
mannigfaltige soziale Geschlechter und Geschlechtsidentitäten jenseits des Zwei- 
geschlechtersystems geben kann. 
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3.2 Relevanzgrad von Gender 


Für die Analyse von Gender-Konstruktionen in Gesprächen spielt der Relevanz- 
grad von Gender, also die mehr oder weniger starke Hervorhebung des Identitäts- 
parameters Geschlecht, eine starke Rolle. Interaktionszug für Interaktionszug 
kann die Geschlechterdifferenz aufgerufen oder vernachlässigt bzw. abgewehrt 
werden. So beschreibt Hirschauer (2001): 


„Ob die Geschlechterdifferenz an den Rand oder ins Zentrum der Aufmerksamkeit 
rückt, vollzieht sich wie die Wahrnehmung einer Orchesterstimme — ob sie als Can- 
tus firmus, als leiser werdende Begleitmelodie oder als bloßes Hintergrundrauschen 
erscheint. Erzeugt wird dieser Eindruck aber durch das Einsetzen, Aussetzen und 


Pausieren einzelner Instrumente.“ (ebd., 217). 


In ihrem Aufsatz „Zur kommunikativen Konstruktion von Geschlechterdifferen- 
zen“ aus dem Jahr 1997 führt Günthner eine Differenzierung ein, die sich an den 
Kontextbegriff der interpretativen Soziolinguistik anlehnt: Sie unterscheidet zwi- 
schen Identitätsparametern, welche Individuen sichtbar und präsent in Interaktio- 
nen einbringen, und solchen, die erst in der Interaktion konstituiert beziehungs- 
weise aktiviert werden. 

Unter sichtbaren Parametern werden beispielsweise körperliche Merkmale, Al- 
ter oder ethnische Herkunft verstanden. Diese sichtbaren beziehungsweise ableit- 
baren Identitätsparameter werden als „brought along“ (deutsch: „etwas mitlaufen 
lassen“) bezeichnet (vgl. Günthner 1997, 134; Kotthoff 2012, 252). Hierzu zählen 
auch Parameter, die sich aus dem Kontext der Interaktion ableiten lassen, wie bei- 
spielsweise institutionelle Faktoren, aus denen sich bestimmte Rollenerwartungen 
ergeben. Sie grenzen sich von jenen Identitätsparametern ab, die in der Interaktion 
aktiv hervorgebracht und daher als „brought about“ (deutsch: „etwas hervorbrin- 
gen“) bezeichnet werden. 

Ein Identitätsparameter wie die Geschlechtszugehörigkeit wird durch be- 
stimmte sichtbare (und hörbare) Indikatoren in eine Situation eingebracht 
(„brought along“) und/oder kann durch bestimmte geschlechtsassoziierte Verhal- 
tensweisen aktualisiert werden („brought about“). Dies ist jedoch kein zwingen- 
der Prozess, wie Günthner (1997) ausführt: 


„Das Geschlecht einer Person ist zwar (wie auch das Alter) i.d.R. als ‚brought a- 
long‘ Phänomen stets ‚präsent‘ (durch körperliche Indikatoren wie Kleidung, 
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Stimme etc.) doch muss es keineswegs stets relevant sein. Es gibt durchaus Situa- 
tionen, in denen das Geschlecht irrelevant ist und andere Identitätskategorien aktu- 
alisiert und fokussiert sind.“ (ebd., 135). 


Geschlecht wird also vom Gegenüber durchaus registriert und läuft dann „brought 
along“ in der Interaktion mit. In jeder Situation existiert die Möglichkeit der 
„brought about“ Relevantsetzung bzw. Aktualisierung des Geschlechts, oder der 
Neutralisierung bzw. des Vergessens des Geschlechtes. Die Aktualisierung der 
Geschlechtsidentität („brought about“) kann entweder durch die Person selbst 
vollzogen werden (,„Selbstaktivierung‘‘), auf die sie sich bezieht, sie kann aber 
auch durch andere „fremdaktiviert‘“‘ werden (vgl. Günthner 2006, 135; bei Hirsch- 
auer 2001, 219: „fremdinduziert‘“ und „selbstrekrutiert“). Bereits initiierte Rele- 
vantsetzungen können ins Leere laufen, indem beispielsweise Anschlusspunkte in 
der Interaktion vermieden werden (vgl. Aulenbacher et al. 2010, 72). 


3.3 Doing Gender 


Geschlecht wird heute zunehmend als ein soziales Konstrukt betrachtet, das erst 
durch die Interagierenden in konkreten sozialen Kontexten hergestellt wird. Das 
Geschlecht einer Person wird in diesem Verständnis von einer ehemaligen Ange- 
legenheit des „Being“ zu einer Angelegenheit des „Doing“ (vgl. Günthner 1997, 
134; Goffman 1994). Dazu Wodak (1997): 


„doing gender’ regards membership of a gender not as a pool of attributes ‚pos- 
sessed’ by a person, but as something a person does. In this sense, membership of 
a gender [constitutes a performative act and not a fact; J. G.]. Gender is continually 


realized in interactional form.“ (ebd., 13). 


Die Annahme der Inszeniertheit von Geschlechterdifferenzen gilt als Grundlage 
für das Konzept des „Doing Gender“, welches beispielsweise von West und Zim- 
merman (1987) folgendermaßen dargelegt wird: 


„Doing gender means creating differences between girls and boys and women and 
men, differences that are not natural, essential, or biological. Once the differences 
have been constructed, they are used to reinforce the ‚essentialness’ of gender.“ 
(ebd., 137). 
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Dieser Ansatz ging aus einer Kritik der vorhergegangenen Erklärungsmuster her- 
vor, „die entweder Dominanzstrukturen im gegengeschlechtlichen Gesprächsver- 
halten von vornherein als gegeben zugrunde legten oder dem Differenzansatz — 
different but equal — folgten“ (Samel 2000, 153). Anstelle universeller Festlegun- 
gen trat also die Kontextualisierung von Geschlechterkonstruktionen in den Vor- 
dergrund, wobei Strategien und Mechanismen dieser Konstruktionen aufgedeckt 
werden sollten. 

Auch wenn das Konzept des „Doing Gender“ als Oberbegriff für jegliche Kon- 
struktionsmechanismen von Geschlecht gefasst werden kann, sollen im Folgen- 
den unter diesem Begriff nur Praktiken der intentionalen und aktiven Markierung 
von Gender angeführt werden. Diese explizit-thematischen Gender-Aktivierun- 
gen können entweder selbst- oder fremdinitiiert werden, das heißt sie können von 
der sprechenden Person selbst ausgehen oder durch das Gegenüber vorgenommen 
werden. 


3.4 Indexing Gender 


Geschlechtliche Differenzierung geschieht seltener über explizit geschlechtsbe- 
zogene Inhalte, sondern vielmehr über die formalen Strukturen des Miteinander- 
sprechens (vgl. Ochs 1992, 340). Solche formalen Strukturen lassen sich weder 
explizit noch hinreichend im Sinne eines kontext- und gattungsübergreifenden 
„Genderlektes“ auf eine Geschlechtszugehörigkeit beziehen (vgl. Günthner 1997, 
123; Samel 2000, 158). Gleichwohl gibt es spezifische Sprechaktivitäten und sti- 
listische Verfahren, die in ihrem Zusammenspiel auf Gender verweisen, da sie 
innerhalb einer Gesellschaft historisch mit geschlechtsspezifischen Assoziatio- 
nen, Erwartungen und Normen verbunden werden (vgl. Kotthoff 2012, 258). 
Dazu merkt Ochs (1992) an: 


„Knowledge of how language relates to gender is not a catalogue of correlations 
between particular linguistic forms and sex of speakers, referents, addressees and 
the like. Rather, such knowledge entails tacit understanding of (1) how particular 
linguistic forms can be used to perform particular pragmatic work (such as convey- 
ing stance and social action) and (2) norms, preferences, and expectations regarding 
the distribution of this work vis-à-vis particular social identities of speakers, refer- 
ents, and addressees. To discuss the relation of language to gender in these terms is 
far more revealing than simply identifying features as directly marking men’s or 


woman’s speech.“ (ebd., 342). 
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Das durch Ochs (1992) geprägte Modell des „Indexing Gender“ versucht sowohl 
den exklusiven als auch den nicht-exklusiven linguistischen Verfahren des Ver- 
weisens auf Gender Rechnung zu tragen, ohne starre Korrelationen herzustellen: 


„A far more favorable model relates linguistic forms to gender either indirectly 
(through other social meanings indexed) or directly. This model displays different 
kinds of language-gender relations and begins to specify the kinds of meanings men 
and woman are likely to index through language, the relation of these patterns to 
the position and images of men and woman in society.“ (ebd., 342). 


Verfahren des „Indexing Gender“ beziehen sich auf das Erkennen von historisch 
gewachsenen sozialen Typisierungsgraden (vgl. Kotthoff 2012, 258). Die so ent- 
standenen „Gender-Folien“ eignen sich für die Inszenierung verschiedener Iden- 
titäten: Mit einem zurückhaltenden Gesprächsstil, der mit „Weiblichkeit“ assozi- 
iert wird, könne ein Mann sich in einem bestimmten Kontext als „Nicht-Macho“ 
oder als „neuer Mann“ inszenieren, während eine Frau bei gleicher Verhaltens- 
weise als „traditionelle Frau“ wahrgenommen würde wie (vgl. ebd.) ausführt. 
Kotthoff (2012, 260) betont dabei, dass die interpretative Rekonstruktion dieser 
Gender-Bezüge nur innerhalb von bestimmten „communities of practice“ erfol- 
gen kann (vgl. Wenger 2002; Günthner 2006, 40; Macur 2009, 42-44). 

Unter dem Gesichtspunkt des „Indexing Gender“ werden im Folgenden mit 
Hilfe von qualitativen Gesprächsanalysen Verweise auf geschlechtsspezifische 
Kulturmuster hin betrachtet. 


3.5 Undoing Gender 


Geschlechterdifferenz ist für die Strukturierung sozialer Interaktion nicht per se 
bedeutsam, sondern es gilt zu überprüfen, wie Geschlecht in kommunikativen 
Praktiken relevant gesetzt oder neutralisiert wird. Wichtig ist dabei zu betonen, 
dass die Nicht-Relevanz von Gender ebenso ein voraussetzungsvoller Inszenie- 
rungsprozess ist wie das „Doing Gender“ selbst (vgl. Kotthoff 2002, 19). Mit 
„Undoing Gender“ werden daher jene Gesprächskontexte beschrieben, denen ex- 
plizite Bezüge zu geschlechtsspezifischem Verhalten fehlen. Es ist zudem zu be- 
achten, dass der Inszenierungsgrad von Gender mit bestimmten kommunikativen 
Aufgaben und Aktivitäten korreliert (siehe bspw. die Speed-Dating-Studie von 
Franz und Günthner (2012)). Daher soll ebenfalls ein Augenmerk darauf gerichtet 
werden, durch welche kommunikativen Aktivitäten die aufgedeckten Inszenie- 
rungsverfahren gerahmt sind. 
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4 _ Konzeption der Untersuchung 


4.1 Das Untersuchungskorpus 


Die Untersuchung wurde anhand des „Halleschen Morningshow-Korpus“ (vgl. 
Finke 2014, 95) durchgeführt, welches authentische Radio-Morningshow-Mit- 
schnitte enthält und innerhalb der halleschen Sprechwissenschaft im Rahmen des 
interdisziplinären Forschungsprojekts „Radioästhetik — Radioidentität‘“ über meh- 
rere Jahre in mehreren Zyklen angelegt wurde. 

Für die vorliegenden Analysen wurden die Daten des größten Teilkorpus des 
Morningshow-Korpus genutzt, das zudem themengebunden erhoben wurde. Das 
Korpus enthält gleich zwei gesprächswertige Alltagsthemen, die bei allen mitge- 
schnittenen Sendern vertreten sind: Weihnachten und der Weltuntergang (d. h. 
das Ende des Maya-Kalenders am 21.12.2012). Daher trägt das Teilkorpus den 
Beinamen „Weihnachts- und Weltuntergangskorpus“, kurz WWK (vgl. Finke 
2019, 109-110). Die Korpuserhebung fand an den fünf Werktagen vom 18. bis 
24. Dezember 2012 jeweils in der Zeit von 06:55 bis 09:05 Uhr statt (also in der 
Radio-Primetime). Das WWK besteht aus insgesamt 78 mitgeschnittenen Mor- 
gensendungen deutscher, österreichischer, schweizerischer sowie britischer Radi- 
osender und hat einen Gesamtumfang von circa 724 Stunden. Es enthält etwa zu 
gleichen Teilen sowohl öffentlich-rechtliche als auch private Sender. 


4.2 Zusammenstellung der Auswahlkorpora 


Im Rahmen der Untersuchungen von Finke (2019) und Galonski (2017) wurden 
aus dem WWK zwei verschiedene Auswahlkorpora zusammengestellt, die hier 
vorgestellt und erläutert werden. 


4.2.1 Auswahl Finke (2019) 


Die drei Kriterien für Finkes Auswahlkorpus waren folgende: gängige Formate, 
meistgehörte Sender und Mehrfachmoderationen. Die so zusammengetragene 
Senderauswahl gilt von einem breiten Publikum als akzeptiert (vgl. Finke 2019, 
112-114). Auf Grundlage der Zahlen zur Mediaanalyse „MA radio 2012 II“ (vgl. 
Verband privater Medien 2012), gleichbedeutend mit den aktuellen Radionut- 
zungszahlen zum Aufnahmezeitraum, wurden aus dem WWK die meistgehörten 
Sender aus Deutschland, Österreich und der Schweiz ausgewählt. Anschließend 
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wurden die Sender in Format-Kategorien eingeteilt — basierend auf dem Alter der 
Hörerzielgruppe (sogenannte Kernzielgruppe und der musikalischen Ausrichtung 
(Musikformat). Die nach der Musikauswahl unterschiedenen Musikformate (vgl. 
Finke 2019, 52-54) sind folgende: 


- Adult Contemporary (AC): Melodische Rock- und Pop-Musik der letzten 
30 Jahre (sogenannter „Mainstream-Pop“) und eine Auswahl an aktuellen 
Hits 

- Contemporary Hit Radio (CHR): Aktuelle Chart-Hits für ein junges Ziel- 
publikum 

- Album Oriented Rock (AOR): Mainstream-orientierte Rockmusik 


Um im Rahmen der (über die Gender-Thematik hinausgehenden) Analysen inner- 
halb einer Kernzielgruppe bzw. eines Musikformats verschiedene Sender verglei- 
chen zu können, wurden zu den meistgehörten Sendern weitere Sender der ent- 
sprechenden Kernzielgruppe aus dem WWK hinzugefügt, sodass pro Kategorie 
möglichst fünf, mindestens aber zwei Sender vertreten waren. Zudem wurden ex- 
plizit Mehrfachmoderationen berücksichtigt, da sie für Morningshows mit den im 
deutschsprachigen Raum vorherrschenden Musikformaten typisch sind (vgl. 
Buchholz 2013; Schwabeneder 2009; Lynen 2004). Weil in Informations- und 
Kulturprogrammen keine Mehrfachmoderationen stattfinden, wurden sie aus der 
Untersuchung ausgeschlossen. Die Auswahl beinhaltete somit 18 Sender (vgl. 
auch Finke 2019, 114; siehe Tabelle 1). Für die Analysen wurden jeweils die Mit- 
schnitte vom 21. Dezember 2012 (dem Tag, an dem der Maya-Kalender endete) 
ausgewählt. 


Nr. | Sender Kernzielgruppe / Format 
01 1 Live 14-39 Jahre / CHR 
02 89.0 RTL 14-29 Jahre / CHR 
03 Bayern 3 14-49 Jahre / AC 
04 Bremen Vier 14-49 Jahre / AC 
05 MDR Jump 20-49 Jahre / AC 
06 MDR Sachsen-Anhalt 40+ Jahre / DOM 
07 NDR2 33-55 Jahre / Hot AC 
08 N Joy 14-29 Jahre / CHR 
09 Ö3 14—49 Jahre / Hot AC 
10 Radio Brocken 30—59 Jahre / AC 
11 Radio Hamburg 20—40 Jahre / AC 
12 Radio ffn Niedersachsen 20—49 Jahre / Hot AC 
13 Radio Lippe 30—59 Jahre / AC 
14 Radio SAW 25—45 Jahre / Hot AC 
15 RPRI 14-49 Jahre / AC 
78 © Frank & Timme Verlag für wissenschaftliche Literatur 


Nr. | Sender Kernzielgruppe / Format 
16 SRF 3 25—45 Jahre / Hot AC 

17 SWR 4 Baden-Württemberg | 50+ Jahre / DOM 

18 You FM 14-29 Jahre / CHR 


Tab. 1: Übersicht — Auswahl Finke (2019) 


4.2.2 Auswahl Galonski (2017) 


Dieses zweite Korpus wurde zusammengestellt, um mit einer tiefergehenden Ana- 
lyse mit dem Fokus auf Gender-Konstruktionen zu überprüfen, ob sich die gen- 
derbezogenen Befunde aus Finkes (2019) Auswahl über den von ihr analysierten 
Tag (21.12.2012) und die getroffene Senderauswahl hinaus belegen lassen (vgl. 
Galonski 2017). 

Die Auswahl von Galonski (2017) enthält insgesamt sechs Sender: vier Sender 
aus Finkes (2019) Auswahl (89.0 RTL, 1 Live, Radio Hamburg, MDR Jump) und 
zwei weitere noch nicht berücksichtigte Sender des WWK (Radio Rockland, Ra- 
dio Erzgebirge). Diese Senderauswahl wird in Tabelle 2 zusammenfassend dar- 
gestellt, wobei für die übernommenen Sender aus Finkes (2019) Auswahl die ur- 
sprüngliche Nummerierung beibehalten wird, während für die ergänzenden 
Sender aus dem WWK der Zusatz „E“ wie „ergänzend“ gewählt wurde. Galonskis 
Auswahl basiert auf folgenden Kriterien: Für die vier Sender aus Finkes (2019) 
Auswahl wurden die Mitschnitte vom 19.12.2012 ausgewählt, um die Befunde 
vom 21.12.2012 zu fundieren, zu erweitern und sicherzustellen, dass die beobach- 
teten Charakteristika in den vorangegangenen Analysen keine Spezifik ihres Aus- 
wahltages darstellen. Für die zwei ergänzenden Sendungsmitschnitte (E1 und E2) 
wurde das Material vom 21.12.2012 untersucht. Bei der Auswahl der Sender 
spielte eine wesentliche Rolle, zu gleichen Teilen Sender mit hierarchischer und 
gleichberechtigter Moderations-Konstellation zu berücksichtigen (vgl. Finke 
2019, 250-258): Gleichberechtigte Moderations-Konstellationen zeichnen sich 
dadurch aus, dass beide Moderierenden in gleicher Weise inhaltsgestaltende Auf- 
gaben übernehmen und einen ähnlich hohen Sprechanteil haben (vgl. Schwabe- 
neder 2009, 145-146). In hierarchischen Moderations-Konstellationen treten die 
Moderierenden hingegen üblicherweise in den Funktionsrollen des Anchors und 
Sidekicks auf. Der Anchor übernimmt die Rolle des Hauptmoderators, während 
der Sidekick diesem als Gesprächspartner*in und Projektionsfläche zur Seite steht 
(vgl. Finke 2019, 23 und Schwabeneder 2009, 145). 
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Team- Nr. | Sender Erhebungstag Kernzielgruppe / 
konstellation Format 

02 | 89.0 RTL 19.12.2012, 7-9 Uhr | 14-29 Jahre / CHR 

11 | Radio Hamburg | 19.12.2012, 7-9 Uhr | 20-40 Jahre / AC 
Hierarchisch | EI | Radio Erzge- 21.12.2012, 7-8 Uhr | 25-49 Jahre / AC 

birge 
01 |1 Live 19.12.2012, 7-9 Uhr | 14-39 Jahre / CHR 
. 05 | MDR Jump 19.12.2012, 7-9 Uhr | 20-49 Jahre /AC 

Gleichbe- [52 |Rockland 21.12.2012, 7-9 Uhr | 25-59 Jahre / Rock 
rechtigt (AOR, Mainstream) 


Tab. 2: Übersicht — Auswahl Galonski (2017) 


4.3  Datenaufbereitung und gesprächsanalytisches Vorgehen 


Bei den untersuchten Interaktionen zwischen Moderator*innen handelt es sich um 
inszenierte Gespräche, welche sich im Vergleich zu Alltagsgesprächen durch eine 
Geplantheit und Öffentlichkeit auszeichnen. Die Moderationsgespräche lassen 
sich aber trotz ihrer Inszeniertheit als „authentische Gespräche“ klassifizieren, „da 
sie genau für die Situation ‚Moderatoren sprechen miteinander für einen Hörer‘ 
gemacht sind“ und nur in dieser Situation stattfinden (vgl. Finke 2014, 100). Da- 
her bietet die Konversationsanalyse wertvolle Ansatzpunkte, um die Mornings- 
how-Gespräche zu analysieren (vgl. dazu Finke 2014, 99-100 und 2019, 91-92). 

Für die Analysen von Finkes (2019) Auswahl wurden die Mitschnitte im Ana- 
lyseprogramm Praat zunächst annotiert und anschließend nach den Konventionen 
des gesprächsanalytischen Transkriptionssystems GAT2 (Selting et al. 2009) ver- 
schriftet. Anschließend wurden die Mitschnitte basierend auf einer Methodentri- 
angulation sowohl qualitativ als auch quantifizierend bezüglich verschiedener 
(über die Gender-Thematik hinausgehender) Fragestellungen untersucht (vgl. 
Finke 2019, 102-107). Auch die Moderationssequenzen der sechs Morgensen- 
dungen in Galonskis (2017) Auswahl wurden für eine systematische Rekonstruk- 
tion der Gespräche nach GAT?2 (als Basistranskript im Transkriptionsprogramm 
Folker) verschriftet. Phänomen- und fragestellungsbezogen wurden ausgewählte 
Gesprächsausschnitte exemplarisch beschrieben und in Bezug auf die dort aus- 
agierten Gender-Konstruktionen qualitativ ausgewertet. Angelehnt an die Über- 
legung zur Gender-Relevanz (siehe Abschnitt 3) wurde erstens die Relevantset- 
zung von Gender auf explizit thematischer Ebene eruiert („Doing Gender“), 
zweitens wurden geschlechtsassoziierte gesprächsstilistische Verhaltensweisen 
innerhalb der Moderationen aufgedeckt („Indexing Gender‘) und drittens wurde 
überprüft, an welchen Stellen eine bemerkbare Abwesenheit von gendertypischen 
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Verfahren zu erfassen ist („Undoing Gender“). Bei der Analyse verdeckter Ver- 
fahren von Geschlechterrolleninszenierungen wurde beachtet, dass Funktion und 
Bedeutung bestimmter kommunikativer Phänomene nur im konkreten, situativen 
Gebrauch innerhalb des interaktiven Kontextes zu ermitteln sind. Sie wurden stets 
im Zusammenspiel mit anderen Phänomenen auf ihre interaktive Funktion im se- 
quentiellen Verlauf innerhalb des kommunikativen Rahmens unter Berücksichti- 
gung der Reaktion des Gegenübers analysiert. 

Eine weitere kritische Frage war außerdem, wie die Geschlechterdifferenz Aus- 
gangspunkt von Forschung sein und zugleich aufgelöst werden kann, um im For- 
schungsdesign für die realen Prozesse der Konstruktion aufmerksam zu bleiben 
(vgl. Aulenbacher et al. 2010, 77). Die Analyse von geschlechtlichen Konstrukti- 
onsprozessen ist nicht frei von Widersprüchen, müssen für die Aufdeckung von 
stereotypen Mustern, die Gender indexikalisieren, doch eigene Stereotypen auf- 
gerufen und reproduziert werden. Dabei lassen sich Geschlechterrollenstereotype 
als gesellschaftlich geteilte Wissensstrukturen auffassen, welche die Wahrneh- 
mung von Verhaltensweisen steuern (vgl. Gottburgsen 2000, 13). Für das Analy- 
sevorgehen war daher ein Bewusstsein darüber wichtig, dass innerhalb des For- 
schungsprozesses selbst „Doing Gender“ stattfindet. Denn auch in diesem Prozess 
wird von den Forschenden im Sinne des Alltagswissens klassifiziert (vgl. Aulen- 
bacher et al. 2010, 77; Macur 2009, 25-26). Hierbei muss auf dichotome Kli- 
schees von „Männlichkeit“ und „Weiblichkeit“ referiert werden, die durch die 
konstruktivistische Wende der Geschlechterforschung eigentlich überwunden 
werden sollten. 


5 Exemplarische Analysen 


5.1 Hierarchische Teamkonstellation 


Für die hierarchisch organisierten Anchor-Sidekick-Konstellationen ist eine un- 
gleiche Verteilung der moderativen Aufgaben charakteristisch, wie sich aus den 
Daten schließen lässt. Diese ungleiche Aufgabenverteilung erhält dadurch eine 
Gender-Relevanz, dass die Rolle des Anchor-Moderators in allen untersuchten 
Sendern mit Männern besetzt wurde, wie sich durch Anredeformen wie Pronomen 
und Namensgebung feststellen lässt. Die Sidekick-Moderatorinnen sind hingegen 
durchweg „weiblich“ besetzt. Die Moderatoren übernehmen durch die Zuweisung 
dieser Funktionsrolle in allen drei untersuchten Sendern den überwiegenden Teil 
der relevanten, inhaltsgestaltenden Moderationsaufgaben: In den hier untersuch- 
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ten Morningshows beginnt stets der „männliche“ Moderator die Moderationsbei- 
träge, gibt relevante Informationen zu inhaltlichen und musikalischen Beiträgen 
der Sendung sowie Teasing-Informationen bzw. die Programmvorschau, nennt 
die Uhrzeit und den Namen des Senders und führt hauptsächlich allein die Inter- 
views mit Studiogästen oder Hörer*innen. Häufiger tritt der Anchor-Moderator 
sogar ganz allein in den Moderationssequenzen auf. Die „weiblichen“ Sidekicks 
zeigen sich innerhalb der Interaktionen stets als Unterstützerinnen des Anchors, 
indem sie durch Rückmeldesignale, Lachen und responsive oder kollaborative 
Turns in Erscheinung treten. Den Sidekick-Moderatorinnen kommt insgesamt nur 
ein geringer Sprechanteil sowie kaum inhaltliche Relevanz zu, was zur Folge hat, 
dass ihre thematischen Kompetenzen und ihre Persönlichkeiten nicht dargestellt 
werden. Die Ergebnisse aus den Analysen der beiden Auswahlkorpora von Finke 
(2019) und Galonski (2017) zeigen übereinstimmend, dass die asymmetrische Ge- 
sprächssituation vor allem der Aufwertung des „männlichen“ Anchor-Moderators 
dient: Dieser repräsentiert über sein Interaktionsverhalten in allen untersuchten 
Morningshow-Mitschnitten mit hierarchischer Teamkonstellation das Bild eines 
humorvollen, kompetenten und persönlichkeitsstarken Gastgebers und Experten. 
Die Hauptfunktion der in dieser Konstellation moderierenden Frauen scheint da- 
rin zu bestehen, stimmliche Abwechslung in die Sendung zu bringen und den 
Aussagen der Anchor-Moderatoren über ihre Reaktionen mehr emotionale Tiefe 
zu verleihen. 

Beispielhaft dafür steht die folgende Moderationssequenz (siehe Transkript 2): 
Sie lässt sich als „Zwischenmoderation“ (zwischen zwei Musiktiteln) einstufen, 
in welcher der „männliche“ Anchor-Moderator (M1) und der „weibliche“ Side- 
kick (M2) eine unterhaltsame Anekdote zum Thema „Beliebtheit von Kirchen zur 
Weihnachtszeit“ präsentieren. Die Gesprächssequenz wird in dem Transkript 
vollständig abgebildet und endet mit dem Einspielen eines Musiktitels. 


001 Ml: sieben uhr DREIzehn- | 1136.000 

002 EV: knallwACH- | 

003 Ml: IN den mittwochMORgen- | 

004 du hörst neunundachtzig null [ER TE EL- | ] 

005 M2: [halLO:::- 1] 

006 M1: <<all>und FALLS du auch langsam> vom GLAUben 
abfällst- | 

007 und nicht WEIRT- | 

008 EV: Song setzt ein 

008 WO: sind die !WA:H!ren !WER!te vom CHRISTlichen 
wEIHnachtsfest hin- | 

009 [JA, || ] 

010 M2: [wo ] SIND sie- || 

011 Ml: na ich FRAG mich das !wWIRK!lich- || 

012 ich MEIN; | 
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013 NICH mal JEder ZWEIte GEHT WEIHnachten 
in die KIRche; || 
014 dabei IS [doch ] WEI:Hnachten so was 
015 M2: [JA- |] 
M1: SCHÖnes; || 
016 JA, | 
017 sowas FESTliches; || 
018 vielLEICHT liegt_s ja auch DAran dass die KIRche 
einfach das (.) !FA:L!sche MARketing hat. || 
019 M2: <<lachend>ehe WA::S?> || 
020 Ml: <<all>naJA ich glaube> (.) WÜRden sie die 
WEIHnachtsmesse auf FACEbook ja, | 
021 als [(.) JE:sus] geBURTStagsFLASHmob 
022 M2: [((lacht)) ] 
M1: [ANkündigen ja, | ] 
M2: [<<laut lachend>>ahahaha>] 
023 M1: dann WÄR die <<rufend>BU:de aber 
[RAPpelvoll da,> ||] 
024 M2: [((lacht laut)) ] <<lachend>was 
NEIN,> || 1169.000 


Transkript 2: „Jesus Flashmob“ (Sender 02; Audio 2) 


Gemäß der klassischen Arbeitsteilung beginnt der über stimmliche Parameter als 
„männlich“ identifizierte Anchor-Moderator M1 die Sequenz mit der Nennung 
der Uhrzeit, des Senderslogans und des Sendernamens. Die „weibliche“ Modera- 
torin M2 bringt sich überlappend zu dem Turn von M1 ins Spiel (Zeile 5), um die 
Hörer*innen zu begrüßen. Durch die Überlappung mit dem Turn von M1 erhält 
ihre Ansprache an die Hörer*innenschaft aber nur bedingten Raum. Der Sprech- 
ausdruck von M2 wirkt dabei durch eine hohe Sprechstimmlage und eine starke 
Dehnung sowie Tonhöhenmodulation des Hauptakzentes aufgedreht und kind- 
lich. Auch der Sprechausdruck von M1 wirkt durch häufiges und starkes Akzen- 
tuieren und eine große Tonhöhenmodulation aufgedreht. Dabei markiert dieser 
übertriebene Einsatz von Sprechausdrucksmerkmalen eine ironische Distanz zu 
dem Gesagten. M1 beginnt in Zeile 6 passend zu diesen prosodischen Merkmalen 
eine humorvolle Anekdote zu entwickeln. Auch in diesem Beispiel zeigt sich eine 
doppelte Ansprache (Zeile 6: „du “) — einerseits gerichtet an M2 und andererseits 
an die Hörer*innenschaft. M2 ergreift durch einen schnellen Anschluss in Zeile 
10 den Turn mit einer Reformulierung der von MI implizit gestellten Frage (Zeile 
8). Ab Zeile 18 verleiht M1 dem von ihm entwickelten Thema (, Christliche 
Werte zu Weihnachten‘) eine Pointe, indem er in unerwarteter Weise auf den As- 
pekt des „Kirchenmarketings“ verweist. M2 untermalt diese Pointe, indem sie 
durch Lachen und das Fragepronomen „Was“ Erstaunen signalisiert (Zeile 19). 
Die Überraschung, die sie dabei ausdrückt, vermittelt den Hörenden den Neu- 
heitswert und die Originalität des von M1 vorgetragenen Gedankens. Die Erwei- 
terung der Pointe erfolgt durch M1 in Zeile 20, 21 und 23, wobei dies von M2 mit 
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einem überdrehten, sich steigernden Lachen kommentiert wird. Das Lachen wirkt 
hierbei kindlich bis überzogen und unterstreicht damit die Komik des von M1 
entwickelten Witzes. Ein kindlicher Eindruck wird in Zeile 24 gefestigt, indem 
M2 das von MI erzeugte Gedankenspiel eines „Jesus Flashmobs“ und dessen 
Erfolgsaussichten bei Kirchengänger*innen abschließend mit einem ungläubigen 
„nein“ kommentiert. 

Hier wird deutlich, wie die Sidekick-Moderatorin den Anchor-Moderator dabei 
unterstützt, sich als Typ „Humorvoll“ (vgl. Finke 2019, 228-234) zu inszenieren: 
Der Moderator präsentiert sich durch seine Anekdote als originell und witzig, 
während die Moderatorin passiv, in kindlicher Weise belustigt und lachend darauf 
zu reagiert. Durch diese intensive emotionale Rückmeldung seiner Kollegin er- 
fährt der „männliche“ Moderator Bewunderung und Wertschätzung für seinen 
Humor. Das von M2 verwendete Lachen lässt sich in diesem Kontext als Gender- 
Index auf „Weiblichkeit“ verstehen, wobei das Bild einer passiv-reagierenden, 
stets albern kichernden und dadurch kindlich wirkenden Frau durch die Interak- 
tion gezeichnet wird. Diese Funktion innerhalb der Interaktion, also dass die Side- 
kick-Moderatorin die vom Anchor entwickelten Witze und humorvollen Anekdo- 
ten durch ihre Reaktionen unterstützt, zeigt sich in fast allen untersuchten 
Sendern. Die Moderatorinnen lachen oder kichern häufig auch an unpassenden 
Stellen und inszenieren sich dadurch als „kindlich-überdreht‘“ oder nahezu 
„dümmlich“, wodurch ein stereotypes, herabsetzendes Frauenbild entsteht. 

Die Ergebnisse von Galonski (2017) zeigen, dass Gender zwar über das durch 
die Funktionsrollen geprägte Gesprächsverhalten der Moderierenden indexikali- 
siert wird, jedoch nur selten auf explizit-thematischer Ebene zum Tragen kommt. 
Zusammenfassend lässt sich feststellen, dass es thematische Kontexte zu geben 
scheint, in denen eine genderisierte Differenzarbeit häufiger vollzogen wird als in 
anderen. In Bezug auf die untersuchten Daten ist dies insbesondere der themati- 
sche Kontext „Weihnachtsgeschenke“, innerhalb dessen divergierende Interes- 
sengebiete der Geschlechter hervorgehoben werden. Dabei wird beispielsweise 
das Spektrum geschlechtsspezifischer Interessen folgendermaßen eingegrenzt: 
„Socken, Technik, Action und Spaß für den Mann — Parfüm für die Frau“ (z.B. 
Sender 1, 8, 14; vgl. Finke 2019, 177). Weitere geschlechtsspezifische Interes- 
senszuordnungen werden inhaltlich thematisch durch Aussagen darüber produ- 
ziert, dass Frauen gerne shoppen (z. B. Sender 5), dass häufig weibliche Orna- 
mentierung im Vordergrund steht (bspw. Sender 11: „Nagellack-Farben“; Sender 
15: „die wettertechnisch richtige Auswahl von Schuhen für den Weihnachtsgot- 
tesdienst“) sowie, dass Frauen und Autos nicht zusammenpassen (z. B. Sender 
13). An „männlichen“ Stereotypen wurde von Finke (2019) senderübergreifend 
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eruiert, dass sich Männer erst „auf den letzten Drücker“ um (Weihnachts-)Ge- 
schenke kümmern (z. B. Sender 1, 5 und 14) und dass Männer eine besondere 
Vorliebe für motorisierte Fahrzeuge haben (z. B. Sender 11, 12 und 13). 

Bei dem Thema „Geschenke zu Weihnachten“ lässt sich neben dieser „Doing 
Gender“-Praxis zudem eine Praxis des „Doing Heteronormativity“ (vgl. Warner 
1991) erkennen, da das Schenken zu Weihnachten in der Regel innerhalb des Be- 
zugsrahmens von heterosexueller Partnerschaft problematisiert wird. So werden 
die Geschenkideen für den Mann häufig von den „weiblichen“ Moderatorinnen 
präsentiert, während beispielsweise Regeln für das Verhalten in einer Parfümerie 
(als „weibliche Sphäre“) von einem Mann vorgestellt werden (z. B. Sender 14). 
Es scheint so, dass die Theorie der Zwei-Kulturen (vgl. Maltz / Borker 1982 und 
Tannen 1991) ihre geistigen Früchte auch noch in das Jahr 2012 trägt: Geschlech- 
terdifferenz wird in den Moderationen, die Finke (2019) untersuchte, in der Regel 
derart inszeniert, dass Frauen und Männer aus unterschiedlichen Kulturen mit di- 
vergierenden Verhaltensregeln stammen, die Missverständnisse erzeugen und so- 
mit eine Übersetzungsarbeit erfordern. Diese Übersetzungsarbeit wird in den ge- 
mischtgeschlechtlichen Moderationsgesprächen stellvertretend geleistet. 

Geschlechtsassoziierte Rollenstereotype werden sowohl von den Moderieren- 
den selbst relevant gesetzt als auch von dem jeweiligen Gegenüber fremdaktiviert. 
Auffällig ist, dass bei einer Mehrzahl der analysierten Sender sowohl von den 
„männlichen“ als auch von den „weiblichen“ Moderierenden häufiger „weibli- 
che“ Stereotype aufgerufen werden, während das thematische Spektrum um 
„Männlichkeit“ seltener aktualisiert wird. Die „weiblichen“ Sidekicks aktualisie- 
ren zwar auch selbst „Frauen-Klischees“ (z. B. Sender, 4, 5, 10, 11, 13). Hier zeigt 
sich aber, dass die Moderatorinnen deutlich häufiger von ihren „männlichen“ Kol- 
legen mit klischeehaften Rollenzuschreibungen konfrontiert werden — zum Teil 
sogar face-schädigend (z. B. Sender 8, 11; vgl. Finke 2019, 266-268), wie das 
folgende Beispiel zeigt (siehe Transkript 3): 

Bei Sender 11 (siehe Transkript 3) kommentiert Moderator M1 den Nagellack, 
den seine Co-Moderatorin M2 aufgetragen hat. Seine Ausführungen beginnt er 
mit einem absurden Berufsvorschlag für den Fall, dass M2 irgendwann keine Ar- 
beit mehr habe (Zeile 439-442). Auf die Frage von M2, wie er darauf komme, 
begründet er seine Idee mit der Farbe ihres Nagellacks (Zeile 448). Zuvor macht 
er noch Anspielungen auf die gute Figur der Moderatorin (Zeile 445-447). 


439 M1: ANke- | 4245.751 
440 wenn du [IRgendwann mal] WIRKlich nicht 
441 M2: [JA. || ] 
M1: mehr WEIßT woHIN, | 
442 dann KANNST du immer noch als !TAN!nenbaum Arbeiten; || 
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443 M2: ICH? | 

444 waRUM, | | 

445 Ml: NICH wegen deiner fiGUR. | 

446 M2: [sondern? || ] 

447 Mi: [die IS wirklich T]Adellos; || 

448 soNdern (.) [WEgen deiner] (.) 

449 M2: [DANke? | | ] 

450 Ml: F:INgernägel. | 

451 SEH ich grade. || 

452 M2: achso, |= 

453 =weil DIE SO: äh peTROLfarben sind. || 4256.751 
Transkript 3: „Tannenbaum“ (Sender 11: AC, 20-40; Audio 3) 
M1 schiebt seine Co-Moderatorin in die Rolle eines „Dummchens“. Er mindert 


ihren Wert, indem er ihr eine Arbeitsmöglichkeit vorschlägt, die ein gängiges Kli- 
schee zuspitzt: Als Frau reicht es, gut auszusehen und einer Arbeit nachzugehen, 
die wenig Intellekt voraussetzt. Es findet das statt, was Schorb und Hartung (2003, 
51-52) in ihrer Untersuchung zu Gewalt im Radio konstatieren: Durch eine un- 
gleiche Machtverteilung in der Rollenkonstellation und durch das Aufgreifen ge- 
sellschaftlich angelegter Klischees werden die Moderatorinnen diskreditiert und 
es entsteht eine „männliche“ Dominanz. 


5.2 Gleichberechtigte Teamkonstellation 


Die hier untersuchten Moderations-Konstellationen zeichnen sich im Gegensatz 
zu den hierarchischen Anchor-Sidekick-Konstellationen auf interaktionaler 
Ebene durch eine gleichberechtigte Verteilung der kommunikativen Aufgaben 
unter den Moderierenden aus. Auf gesprächsstilistischer Ebene tritt hier eine re- 
levante Abwesenheit von gendertypischen Verfahren („Undoing Gender“) zu 
Tage. Für beide Moderierenden entsteht ein hoher Status, da sie sich in den Ge- 
sprächen gleichermaßen und geschlechtsunabhängig als kompetente Expert*in- 
nen und humorvolle Gastgeber*innen inszenieren können. Entsprechend dazu, 
dass beide Moderierenden in gleichem Maße die verschiedenen Moderationsauf- 
gaben erfüllen, haben sie einen ausgeglichenen Redeanteil und bringen sich ge- 
schlechtsunabhängig themeninitiierend in die Moderationen ein. Zudem unter- 
stützen die Moderierenden einander bei der Themen-Verfertigung beispielsweise 
durch Rückmeldesignale in gleichberechtigter und kooperativer Weise. 

Das folgende Beispiel von Sender E2 (siehe Transkript 4) lässt sich als Zwi- 
schenmoderation einstufen, in welcher die Moderierenden das zum Erhebungstag 
aktuelle Thema „Weltuntergang laut Maya-Kalender“ thematisieren. Dies dient 
als Rahmen, um relevante Neuerungen aus Politik, Wirtschaft, Sport und Kultur 
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für das kommende Jahr 2013 vorzustellen. M1 lässt sich hierbei durch stimmliche 
Eigenschaften und Anredeformen „brought along“ als Mann identifizieren, M2 
als Frau. 


001 Ml: und DAmit ist es VIER nach ACHT- || 5208.000 

002 SCHÖNen guten MORgen- |= 

003 =hier sind FRANzi und THOmas; || 

004 M2: SCHÖNen guten MORgen- 

005 und WENN wir den HEUtigen TAG überLEben sollten- | 

006 DANN gibts ZWEItausenDREIzehn ein paar DINge, | 

007 °hh auf DIE wir uns echt FREUN können; | 

008 Ja, | 

009 die GEZ gebührn zahlt NICHT mehr jeder EINzeln- | 

010 sondern NUR noch pro HAUShalt- | 

011 UND, | 

012 °hh die PRAxisgebühr wird Ebenfalls ABgeschafft- | 

013 ABsolut TOP; | 

014 Mi: was nicht GANZ so TOP is- | 

015 sind die PREISerhöhungen beim STROM- | 

016 und AUCH dass FUßballtrainer felix Magath jetzt !DOCH! 
wieder [auf die TRAInerbank will; ||] 

017 M2: [((lacht)) ] 

018 Mi: MENSCH- | 

019 O:H; || 

020 M2: JA- | 

021 aber ALL das werden wir überLEben- | 

022 EV: Song setzt ein 

023 M2: denn zweitausenDREIzehn wird ein !HAM!merjahr 
mit HAMmeralben; || 

024 LYing; | 

025 LESli CLIo- | 

026 und DEpeche MODE; | 

027 DIE melden sich zu!RÜück!; | 

028 °h wann geNAU, | 

029 DAS hört ihr nach den NÄCHsten beiden SONGS- || 

030 Ml: CRO (-) EINmal um die WELT spieln wa euch- | 

031 und das hier sind GARbage- | 

032 BLOOD (.) for POPies- || 

033 mach AN (.) und LAUT; || 5247.000 


Transkript 4: „Hammerjahr“ (Sender E2; Audio 4) 


MI beginnt die Sequenz, indem er die Uhrzeit nennt, die Hörer*innen begrüßt 
und seine Kollegin und sich mit Vornamen vorstellt (Zeile 1-3). M2 schließt da- 
ran durch einen glatten Sprecherwechsel an und begrüßt die Hörer*innen eben- 
falls. In Zeile 5-7 initiiert sie das Oberthema der folgenden Sequenz und gibt das 
erste Beispiel einer Aufzählung über „Dinge, auf die man sich 2013 freuen kann“. 
In Zeile 13 bewertet sie das gegebene Beispiel positiv. M1 knüpft in seinem da- 
rauffolgenden Turn ab Zeile 14 an die von M2 gegebene Formulierung an und 
gibt zwei Beispiele für Neuerungen im Jahr 2013, welche er als negativ bewertet. 
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Dieses Werturteil untermauert MI durch einen emotionalen Ausruf in Zeile 19, 
welcher prosodisch markiert, dass er davon genervt ist. M2 goutiert seine Reak- 
tion mit einem Lachen und drückt dadurch Bestätigung für sein Werturteil aus. 
Sie schließt das Unterthema der negativen Neuerungen für 2013 in Zeile 21 ab 
und leitet wieder über zu Neuerungen (im Bereich Musik), welche sich positiv 
bewerten lassen. Sie nennt dafür drei Beispiele (Zeile 24-26) und gibt einen Hin- 
weis für das folgende Programm (Zeile 28-29). M1 schließt kollaborativ an ihren 
Turn an und spezifiziert die Programmvorschau, was gleichzeitig eine Überlei- 
tung zu dem nächsten Musiktitel darstellt. 

Die Sequenz zeigt die beiden Moderierenden als Ko-Produzierende eines The- 
mas. Sie inszenieren sich dadurch als stark zusammengehöriges Team, welches 
in kollaborativer Weise Themen verfertigt. Ihr Sprechanteil ist ausgeglichen und 
die Turnwechsel verlaufen in der Regel glatt und sind thematisch aufeinander be- 
zogen. Tendenziell gliedert sich in diesem Beispiel der „männliche“ Moderator 
MI eher in die vorgegebenen thematischen Strukturen der „weiblichen“ Modera- 
torin ein. Gleichwohl treten beide Moderierenden als meinungsstarke Expert*in- 
nen und Gastgeber*innen auf. Das Geschlecht der Moderierenden tritt hierbei ins- 
gesamt in den Hintergrund und wird nicht weiter „brought about“ aktualisiert. 
Diese kollaborative Form der Themenverfertigung, stellt eine Form des „Undoing 
Gender“ dar, welche sich in allen untersuchten Sendern mit gleichberechtigter 
Moderations-Konstellation nachweisen lässt. Sie tritt insbesondere dann auf, 
wenn die Moderationsbeiträge stark themenzentriert und informationsgebunden 
sind, wie beispielsweise in An- und Abmoderationen von thematischen Beiträgen 
und beim Präsentieren der Programmvorschau. 

Die Analysen zeigen, dass sich die Moderierenden in gleichberechtigt organi- 
sierten Moderations-Konstellationen häufig über die Interaktionsmodalität „Dis- 
sen“ (vgl. Finke 2019, 69-71) durch gegenseitige scherzhafte Face-Angriffe als 
„Kumpel“ inszenieren. Dabei offenbart sich in dem Interaktionsverhalten der Mo- 
derierenden eine „kooperative Kompetitivität“, was ebenfalls als eine Form des 
„Undoing Gender“ betrachtet werden kann. Es ist zu vermuten, dass hier die 
Kommunikationspraxis einer jungen Zielgruppe aufgegriffen wird, wobei an die- 
ser Stelle nicht bewertet werden kann, ob gegenseitiges Dissen in der angespro- 
chenen „community of practice“ als eine geschlechtsunabhängige oder tendenzi- 
ell auf „Männlichkeit“ indizierte Praxis geführt wird. 

Im Beispiel von Sender 5 (siehe Transkript 5) zieht Moderator M1 seine Co- 
Moderatorin damit auf, dass für ihn nicht nur heute Weltuntergang ist (Zeile 426), 
sondern er mit ihr an seiner Seite quasi täglich damit konfrontiert ist (Zeile 429- 
431). Moderatorin M2 spielt sein Spiel mit, indem sie beleidigt reagiert (Zeile 
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432). Anschließend kontert sie damit, dass der Witz von M1 schlecht war, und 
verweist darauf, dass die Hörer*innen des Senders auf der Facebook-Seite der 


Morgensendung weitaus Lustigeres zum Weltuntergang schreiben (Zeile 434- 
436). 

422 Ml: wenn MENschen wie SArah. | 3682.650 

423 HEUte auf /SIE ZUkomm- |= 

424 =UND sowas SAgen wie- 

425 <<schreiend>HA- |> 

426 <<rufend>HEUte ist WELTuntergang; |> 

427 <<p, ->dann GIBT_S nur EIne ANTwort. 

428 NÄMlich- |> 

429 WELTuntergang? | 

430 na UND? | 

431 den erLEB ich JEden tag mit <<rufend>[“DIR]; |> 

432 M2: <<beleidigt lachend>jahahaha[HA::: |> ] 

433 M1: [((lacht))] 

434 M2: IWIRK!lich witzige ANTworten auf diese 

WELTuntergangsPHRAse, |= 
435 =gibt_s übrigens AUF unserer FACEbookseite. |= 
436 =NE? || 3700.867 


Transkript 5: „Weltuntergang — Jeden Tag mit dir“ (Sender 05; Audio 5) 


Anders als in den hierarchischen Konstellationen findet sich in den Moderations- 
gesprächen durch den gleichberechtigten Umgang der Moderierenden auf inter- 
aktionaler Ebene kein bereits fest abgesteckter Rahmen, innerhalb dessen eine 
Kontrastierung der Moderierenden eingebettet ist. Die Differenzarbeit wird hier 
im Gegensatz zu den hierarchischen Konstellationen häufiger durch eine starke 
Relevantsetzung von Gender in Zusammenhang mit der Persönlichkeitsinszenie- 
rung der Moderierenden vollzogen. Die Moderatorin zeichnet sich beispielsweise 
durch ihre Liebe zur Dekoration aus, während der Moderator damit nichts anfan- 
gen kann; „sie“ geht auf den Weihnachtsmarkt zum Shoppen, „er“ hingegen, um 
Frauen kennenzulernen usw. (z. B. Sender 5 und 14). Diese Kontraste werden 
durch Formen des explizit-thematischen „Doing Gender“ zusätzlich genderisiert, 
indem sie nicht nur auf die Persönlichkeit der Moderierenden, sondern verallge- 
meinernd auf alle Frauen und Männer bezogen werden. Somit wird Gender indi- 
rekt auch für die Hörer*innenschaft „brought about“ fremdaktiviert. Dabei wer- 
den sowohl „männliche“ als auch „weibliche“ Klischees in einer unkritischen 
Weise bedient. So greift Sender 5 (siehe Transkript 6) das Thema „Studio-Weih- 
nachtsbaum“ auf. Die Gesprächssequenz findet im Anschluss an Verkehrs- und 
Wetterinformationen statt und leitet zu einem umfassenderen Moderationsbeitrag 
zu dem Thema „Weihnachtsbaumaktion“ über. M1 lässt sich „brought along“ als 
Mann identifizieren, M2 als Frau. 
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001 Mi: pu:h; | 4863.000 


002 ich bin langsam ganz schön KRAFTlos; || 
003 wer DENKT- | 
004 [sarahs DEKOwahn ist] nicht zu STOPpen- | 
005 M2: [( C kichert)) °hh ] 
006 Ml: KLICKen sie sich auf JUMP radio de E:- 
007 und SCHAUen sie unsere WEBcam- | 
008 SArah hat GEStern den BAUM geschmückt; | 
009 dieses LEUCHtende bunte ETwas; | 
010 M2: [((lacht)) ] 
011 MI: [was NUR mit fantaSIE hh°] 
012 einer GRÜnen !TAN!ne: irgendwie geRECHT wird- | 
013 naJA; || 
014 ähm- | 
015 vielLEICHT überlassen SIE ja auch das BAUMschmücken 
ihrer FREUNdin zu hause oder so- |= 
016 =oder ertragen es STILschweigend- | 
017 oder sie haben GLÜCK, | 
018 und haben ne FRAU mit SELBSTbewusstsein 
und STILbewusstsein- | 
019 keine AHnung- || 
020 °hh KLINgeln se mal DURCH- | 
021 wie IS das denn bei IHrem baum zu hause; 
022 ((Telefonnummer))- || 
023 is der AUCH so HÄSSlich wie SArahs- | 
024 M2: [SAG mal- || ] 
025 M1: [oder GEHT es- ||] 
026 wir werden es KLÄREN- | 
027 in drei miNUten, | 
028 gegen ACHT uhr ZWANzig; || 
029 EV: Song setzt ein 4897.000 


Transkript 6: „Dekowahn“ (Sender 05; Audio 6) 


M1 initiiert das Thema, indem er direkt auf den „Dekowahn“ seiner Kollegin ver- 
weist und diesen durch die Wortwahl („Wahn“) und die Äußerung, dass ihn dieser 
„kraftlos“ machen würde, negativ bewertet (Zeile 1—4). Hierbei offenbart sich ein 
Gender-Index in Bezug auf ein klassisch „weibliches‘“ Interessengebiet: Frauen — 
so auch M2 - lieben es zu schmücken, dekorieren und gestalten, so das Klischee. 
MI fährt in Zeile 9-11 fort, den Baumschmuck abzuwerten, worauf M2 mit Ge- 
lächter reagiert (Zeile 10). In Zeile 15-18 wird der Gender-Index in Bezug auf 
„weibliche“ Dekorationsliebe von M1 explizit gemacht, indem MI den Aufga- 
benbereich des Baumschmückens einseitig auf Frauen bezieht. Damit wird so- 
wohl für die „weibliche“ Moderatorin M2 Gender „brought about“ relevant ge- 
setzt wie auch für die „weiblichen“ Hörerinnen fremdinitiiert. Hierbei ist die 
„weibliche“ Moderatorin, welche durch ihr Lachen Bestätigung ausdrückt, gleich- 
ermaßen an der Inszenierung dieses stereotypen Frauenbildes beteiligt. Durch die 
Formulierung in Zeile 15 eröffnet M1 zudem einen heteronormativen Bezugsrah- 
men und spricht (durch die Ansprache „überlassen Sie [...] Ihrer Freundin zu 
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Hause “) nur die „männlichen“ Hörer an. Mit diesen stellt er eine Art „männliche“ 
Verbundenheit her, indem er in Zeile 16 seine Gefühle auf die Hörer projiziert 
und damit suggeriert, dass alle Männer unter dem „Dekowahn “ ihrer Freundinnen 
zu leiden hätten. Dies impliziert auch, dass Männer selbst nicht gerne dekorieren, 
sondern dies höchstens „stillschweigend ertragen“. Damit inszeniert sich M1 
„brought about“ als „männlich“ und macht gleichzeitig eine verallgemeinernde 
Zuschreibung für sein „männliches“ Publikum. Die von M1 und M2 inszenierten 
Differenzen bemühen zur Schärfung ihrer Persönlichkeit dichotome Geschlech- 
terstereotype, wobei klassisch „weibliche“ Eigenschaften tendenziell abgewertet 
werden. 

Auch in gleichgeschlechtlich besetzten „Mann-Mann“-Konstellation (z. B. 
Sender 1 und 8) wird das Geschlecht in Zusammenhang mit der Persönlichkeit 
der Moderatoren sowohl in An- und Abmoderationen als auch in Zwischenmode- 
rationen stark in Szene gesetzt. Dabei sind unterschiedliche Strategien festzustel- 
len: Zum Einen stilisieren beide Moderatoren in kollaborativer Weise „Männlich- 
keit“-indexikalisierende Verhaltensweisen, indem sie sich gemeinsam 
beziehungsweise gegenseitig als „archaisch“, „derb“ und „ungehobelt“ inszenie- 
ren. Zum anderen sind aber auch hier Indexe auf „Weiblichkeit“ zu finden, in dem 
sich beispielsweise einer der Moderatoren in seinen Interessen und Ansichten 
klassisch „weiblich“ besetzten Gebieten zuordnet. Der Einsatz von Gender-Kli- 
schees liegt demnach nicht lediglich in der jeweiligen gemischtgeschlechtlichen 
Teamkonstellation begründet, vielmehr zeigt sich, dass aktive Bemühungen in der 
Rollenausgestaltung und Persönlichkeitsinszenierung angestellt werden, um Ge- 
schlechterklischees verhandeln zu können. 

Im Beispiel von Sender 8 (siehe Transkript 7) berichtet Moderator MI, dass er 
nicht nur den Weihnachtsbaumeinkauf noch vor sich hat (Zeile 316-317), sondern 
außerdem noch alle Geschenke besorgen muss (Zeile 315, 319). Er äußert jedoch 
erleichtert, dass er zumindest für seine Frau kein Geschenk besorgen muss, weil 
sie ausgemacht haben, dass sie sich dieses Jahr nichts schenken (Zeile 324-325). 
Moderator M2 nimmt nun die Gegenposition ein, die einem Frauenklischee zuge- 
ordnet werden kann: In einer Partnerschaft schenkt man sich etwas, andernfalls 
liebt man sich nicht mehr (Zeile 330-331). Als Moderator M1 dies als Unsinn 
abtun möchte (Zeile 332), widerspricht M2 und zieht für seinen Standpunkt un- 
terstützend diverse Hörer-O-Töne hinzu (Zeile 333-337). 


315 M1: muss NOCH (.) 3913.466 
WEIHnachtsgeschenke kaufen. || 

316 also !BAUM! unter anderm AUCH noch; | 

317 n BAUM muss ich kaufen. || 

318 M2: hab ich ALles schon. || 
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319 Ml: ja geSCHENke äh äh hab ich auch noch (.) KEIne. || 
320 M2: (2.4) ja- | 
321 (---) ja äh daf- | 
322 Ml: geSCHENke hast DU schon oder was; || 
323 M2: hab ich AUCH schon ja; || 
324 MI> ey ich bin FROH dass ich äh WEnigstens 
NICHTS für meine FRAU brauche. || 
325 also wir SCHENken uns nämlich dieses jahr GAR nix. || 
326 M2: JA; || 
327 (.) waRUM nich? || 
328 M1: [äh 1 0.) ja- || 
329 M2: [(was/das)] 
330 ich FINde ja wer sich an WEIHnachten nichts SCHENKT 
hardeland, | 
331 der LIEBT sich auch nich mehr. || 
332 M1: was_n DAS fürn QUATSCH; || 
333 M2: das IS kein quatsch; || 
334 keine WEIHnachtsgeschenke: - | 
335 keine LIEbe:; || 
336 so sieht_s nämlich AUS. || 
33H EV: Hörer-Töne 3945.254 


Transkript 7: „Weihnachtsgeschenke“ (Sender 08; Audio 7) 


Stilisieren beide Moderatoren „männlich“-indexikalisiertes Verhalten, manifes- 
tiert sich in ihren Interaktionen zumeist eine starke Praxis des „Doing Heteronor- 
mativity“, indem die Moderatoren häufiger in expliziter Weise ihre aktive Hete- 
rosexualität betonen, wie das folgende Beispiel von Sender 1 zeigt. Die Sequenz 
(siehe Transkript 8) dient als Abmoderation eines Interviews, welches die Mode- 
ratoren mit einem Reporter in Mexiko zum Thema „Weltuntergang“ geführt ha- 
ben. Inhaltlicher Rahmen dieses Interviews ist eine Gewinn-Aktion, in welcher 
zehn Hörer*innen unter dem Motto „Helden fliegen nach Mexiko, um die Welt zu 
retten“ eine Reise nach Mexiko — dem Land der Maya — gewonnen haben. In 
ironischer Weise wurde von dem Reporter berichtet, wie die Urlaubsgruppe am 
Strand und am Meer nach Spuren des Weltuntergangs sucht. Daran knüpft die 
folgende Sequenz an: 


001 Ml: DAtensammeln am STRAND- | 2765.000 
002 das KENNSt du olli- | 
003 von malLORca- | 
004 mit den teleFONnummern der Mädels, || 
005 M2: RICHtig- | 
006 geNAU ja, || 
007 M1: ECHte HELden aus dem eins LIVE sektor- | 
008 SIND mit unserm eins LIVE reporter 
jörn BEHR gerade in MEXiko- |= 
006 =!UM! am FREItag die WELT zu retten; || 2774.000 


Transkript 8: „Telefonnummern der Mädels‘ (Sender 01; Audio 8) 
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An dieser Stelle wird deutlich, dass M1 ein beliebiges Thema bemüht, um einen 
Verweis auf eine aktive Heterosexualität der Moderatoren zu geben. In diesem 
Fall findet eine Zuweisung dieser Heterosexualität von M1 zu seinem Kollegen 
statt (Zeile 2). M2 bestätigt diese Zuschreibung in Zeile 5-6. Auf diese Weise 
inszenieren die Moderatoren ihre Nähe zueinander in einem klaren heteronorma- 
tiven Rahmen. 

Die Analysen haben insgesamt hervorgebracht, dass insbesondere dann, wenn 
die Beziehung der Moderierenden und deren Persönlichkeit in den Fokus der In- 
teraktion rücken, was häufig in Zwischenmoderationen vorkommt, gender-inde- 
xikalisierende Zuschreibungen aufgerufen werden und Gender auf explizit-the- 
matischer Ebene relevant gesetzt wird. Die Neutralisierungsarbeit auf der 
interaktionalen Ebene, insbesondere durch die Interaktionsform „Dissen“, wird 
entsprechend durch eine starke Relevantsetzung von Gender in der Persönlich- 
keitsinszenierung der Moderierenden ausgeglichen. Diese Beobachtung wird 
dadurch gestützt, dass Sender E2 aus Teilkorpus 2 ein abweichendes Beispiel der 
beschriebenen Strategien darstellt. In den Interaktionen dieses Senders ließ sich 
keine Belegstelle finden, welche eine „brought about“-Aktualisierung von Gender 
belegen würde. Dies könnte damit im Zusammenhang stehen, dass auch die Per- 
sönlichkeitsinszenierung der Moderierenden in den Moderationsbeiträgen nur 
hintergründig verläuft. Dabei treten andere Identitätsfacetten in den Vordergrund: 
Sie präsentieren sich beide als fachlich kompetente Expert*innen, insbesondere 
im Bereich der angebotenen Musik. Im Gegensatz zu den Sendern 1 und 5, welche 
in ihrer musikalischen Ausrichtung ein breites Publikum ansprechen, bietet Sen- 
der E2 ein zielgruppenspezifisch enges Musikformat an (siehe Tabelle 2). Hier- 
durch ist die Senderidentität womöglich bereits soweit gefestigt, dass eine starke 
Inszenierung der Moderatoren-Personality keinen großen Stellenwert einnimmt. 
Eine weitere Hypothese ist, dass seitens der Radio-Produzierenden angenommen 
wird, dass die so angesprochene „community of practice“ nicht auf eine (klischee- 
hafte) Geschlechterrollen-inszenierung anspricht. 

Diese Befunde untermauern die These, dass Genderinszenierung in den Mehr- 
fach-Moderationen eng mit der Persönlichkeitsinszenierung (sog. Moderatoren- 
Personality; vgl. Finke 2019, 42-48) verwoben und als Differenzierungsmerkmal 
zwischen den Moderierenden genutzt wird. Je stärker die Inszenierung der Sen- 
deridentität eines Radiosenders auf die Personality der Moderierenden abzielt, 
desto stärker tritt auch eine stereotype geschlechtliche Inszenierung der Moderie- 
renden in den Vordergrund. Brüche mit solchen konventionellen Geschlechterin- 
szenierungen ließen sich in Galonskis Auswahl nicht feststellen. In Finkes Aus- 
wahl sind zwar gelegentlich Brüche zu beobachten, indem Gender-Klischees 
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vertauscht werden (z. B. Sender 4, 7-9: Moderatorin ist Fußballfan, Moderator ist 
familiär-romantisch veranlagt, Moderator hat Schuhtick), jedoch zeugen auch 
diese von einem konservativen Bild. Denn alle Brüche funktionieren nur dann, 
wenn die Zielgruppe um die Klischees und Stereotype weiß und diese zugrunde 
legen kann, um eine Abweichung als solche zu verstehen. Werden Brüche insze- 
niert, erfolgt dies also stets im Spiel mit Berufungen auf konservative bzw. kli- 
scheehafte Geschlechterrollen, wodurch das Klischee letztendlich reproduziert 
wird. Abschließend ist festzuhalten, dass jene Sender, die verstärkt mit Brüchen 
arbeiten oder „einmal etwas anders machen“ und sich damit vom Mainstream ab- 
heben, nicht zu den meistgehörten Sendern (im Sinne der Mediaanalyse-Zahlen 
zur Hörerreichweite) zählen. Es zeigt sich, dass es für die Mehrheit der Radiosen- 
der und insbesondere für die meistgehörten Sender anscheinend zu riskant ist, 
konservativen Geschlechterrollen abzuweichen. 


6 Ergebnisse 


Insgesamt bestätigt sich übereinstimmend anhand der Auswahlkorpora von Ga- 
lonski (2017) und Finke (2019), dass Differenzarbeit ein wichtiges stilistisches 
Mittel innerhalb von Mehrfach-Moderationen darstellt. Das gesellschaftlich 
grundlegende Dichotom „Mann-Frau“ wird zur Kontrastierung der Moderieren- 
den untereinander bemüht. Die Ergebnisse der Analysen ergeben ein differenzier- 
tes Bild der Gender-Konstruktionen in Bezug darauf, ob die Mehrfach-Moderati- 
onen hierarchisch oder gleichberechtigt organisiert sind: 

Die hierarchisch organisierten Moderations-Konstellationen zeichnen sich 
durch eine einseitige Besetzungspolitik aus. Die Rolle des Anchors kommt stets 
den Moderatoren zu, während die Rolle des Sidekicks in allen untersuchten Fällen 
mit Moderatorinnen besetzt ist. Das hierarchische Interaktionsverhalten der Mo- 
derierenden wirkt gender-indexikalisierend und setzt das Geschlecht der Mode- 
rierenden im Gesprächsverlauf latent „brought about“ relevant. Die Sidekick-Mo- 
deratorinnen zeigen sich innerhalb der Interaktionen auf gesprächsstilistischer 
Ebene durch einen geringen Sprechanteil, emotionalisierende Hörerinnenaktivi- 
täten und häufigen responsiven oder kollaborativen Turns als Unterstützerinnen 
des „männlichen“ Anchors. Sie initiieren selten eigene Themen, wodurch ihnen 
kaum inhaltliche Relevanz zukommt und ihre Persönlichkeit unbestimmt bleibt. 
In der Kombination aus der ungleichen Arbeitsteilung und diesen gender-indexi- 
kalisierenden gesprächsstilistischen Mitteln entsteht das Rollenbild des status-ho- 
hen und originellen „männlichen“ Experten, während die moderierenden Frauen 
als uneigenständige, emotionale und unterstützende Accessoires stilisiert werden. 
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Die Anforderungsprofile der Funktionsrollen von Anchor und Sidekick korrelie- 
ren hier mit stereotypen Vorstellungen von „männlicher Dominanz“ und „weibli- 
cher Gesprächsarbeit“. Durch die einseitige Besetzungspolitik wird eine dicho- 
tome, geschlechtszuschreibende Praxis reproduziert und damit unterstützt. 
Auffällig ist, dass Gender nur selten auf explizit-thematischer Ebene relevant ge- 
setzt wird. Eine mögliche Hypothese dazu ist, dass die gender-indexikalisierenden 
Differenzen im Interaktionsverhalten über die festgelegten Funktionsrollen des 
Anchor und Sidekicks die Geschlechtszugehörigkeit der Moderierenden bereits 
soweit rahmen, dass eine zusätzliche Aktivierung aufthematischer Ebene weniger 
Relevanz zukommt. 

Auch bei den gleichberechtigten Moderations-Konstellationen zeigt sich eine 
einseitige Besetzungspolitik. Die Teams sind entweder gemischtgeschlechtlich 
oder rein „männlich“ besetzt. Eine Team- Konstellation aus zwei oder mehreren 
Frauen, die in der Radio-Primetime miteinander moderieren, lässt sich im gesam- 
ten Korpus nicht nachweisen. Auf gesprächsstilistischer Ebene tritt im Gegensatz 
zu den hierarchischen Konstellationen eher eine relevante Abwesenheit von gen- 
dertypischen Verfahren hervor. Durch eine gleichberechtigte Arbeitsteilung in- 
nerhalb der Gesprächsorganisation entsteht geschlechtsunabhängig ein hoher Sta- 
tus für beide Moderierenden: Sie können sich gleichermaßen als kompetente 
Expert*innen und humorvolle Gastgeber*innen inszenieren, was als eine Praxis 
des „Undoing Gender‘ gewertet werden kann. Diese Neutralisierungsarbeit wird 
dadurch ausgeglichen, dass in der Persönlichkeitsinszenierung der Moderierenden 
„Doing Gender“ eine große Rolle zu spielen scheint, indem häufig auf explizit- 
thematischer Ebene stereotype geschlechtsassoziierte Zuschreibungen und gend- 
erisierte Klischees genutzt werden. Die Inszenierung der Moderatoren-Persona- 
lity wird mit der Darstellung dichotomer geschlechtlicher Identitäten verknüpft, 
wodurch eine Typisierung der Geschlechter entsteht. Anders als in den hierarchi- 
schen Konstellationen gibt es durch den gleichberechtigten Umgang der Mode- 
rierenden auf interaktionaler Ebene keinen bereits fest abgesteckten Rahmen, in 
den eine Kontrastierung der Moderierenden eingebettet ist. Die Differenzarbeit 
wird im Gegensatz zu den hierarchischen Konstellationen durch eine starke Rele- 
vantsetzung von Gender in Zusammenhang mit der Persönlichkeitsinszenierung 
der Moderierenden vollzogen. Dies gilt insbesondere für diejenigen Sender, wel- 
che über ihr musikalisches Format eine breite (Mainstream-orientierte) Ziel- 
gruppe ansprechen. In Sendern mit einem zielgruppenspezifisch engen Musikfor- 
mat (z. B. ausschließlich Rockmusik) werden Geschlechterdifferenzen hingegen 
nicht aktiv zum Thema gemacht. Durch die spezifische thematisch-musikalische 
Ausrichtung ist die Senderidentität womöglich bereits soweit gefestigt, dass eine 
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starke Inszenierung der Moderatoren-Personality über ihre Geschlechtszugehö- 
rigkeit keinen großen Stellenwert einnimmt. Möglichweise wird seitens der Ra- 
dio-Produzierenden angenommen, dass die so angesprochene „community of 
practice“ nicht auf eine (klischeehafte) Geschlechterrolleninszenierung anspricht. 


7 Diskussion und Ausblick 


Die Untersuchung von Gender-Konstruktionen in der Radio-Primetime hat deut- 
lich gezeigt, dass Gender in den Interaktionen zwischen den Moderierenden eine 
große Relevanz zukommt, indem Geschlecht als Differenzierungsmerkmal zwi- 
schen den Moderierenden ausagiert wird. Durch die qualitativen Analysen konn- 
ten anhand von typischen Einzelfällen handlungsleitende Muster und Werte in 
Bezug auf die Gender-Konstruktionen in der Radio-Primetime rekonstruiert wer- 
den. Die Ergebnisse sind vor dem Hintergrund zu betrachten, dass die Anwendung 
des „Indexing Gender“-Ansatzes im Rahmen dieser Untersuchung auf subjekti- 
ven Interpretationen beruhen. Es stellt ein wissenschaftliches Problem dar, da es 
keinen eindeutigen Referenzrahmen dafür gibt, welche Eigenschaften als Indizes 
für „Männlichkeit“ oder „Weiblichkeit“ gewertet werden können. So ist es bei- 
spielsweise nicht eindeutig, ob eine Eigenschaft wie „Kompetitivität“ als „männ- 
lich“ interpretiert werden kann. Vorstellungen von „Männlichkeit“ und „Weib- 
lichkeit“ sind nicht gesellschaftlich einheitlich definiert, sondern beruhen auf 
Vereinbarungen innerhalb bestimmter „communities of practice“. Geschlechter- 
rollenbilder sind in ihren Ausformungen hochgradig divers und fluide. Für die 
weitere Erforschung von gender-indexikalisierenden Verfahren ist daher unab- 
dingbar, die Ebene der Rezeption mit einzubeziehen, beispielweise in Form einer 
Befragung von Hörer*innen. 

Innerhalb dieser Untersuchung ließ sich vorerst nachweisen, dass über eine 
genderisierte Zuordnung von Funktionsrollen und die Verquickung von Gender- 
Aktivierungen mit der Persönlichkeitsinszenierung der Moderierenden ein stere- 
otypes Identitätsangebot gestiftet wird. Kontraste zwischen den Moderierenden 
werden unter anderem durch klassische, genderisierte Dichotomien hergestellt. 
Die so gezeichneten Konzepte des „Doing Gender“ und „Doing Heteronormati- 
vity“ in der Radio-Primetime bilden einen konservativen, heteronormativen Ge- 
sellschaftsdiskurs ab, in welchem einer Diversität von Gender-Identitäten und se- 
xuellen Orientierungen keine Geltung zukommt. 

Dass die so orientierten Morningshow-Formate bei ihren Rezipierenden (laut 
MA radio 2012 II) offenbar großen Anklang finden, ist ein Indiz dafür, dass ste- 
reotype Geschlechterrollenbilder nach wie vor weit verbreitet und akzeptiert sind. 
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Gleichzeitig ist zu betonen, dass das Massenmedium Radio sowohl als Reprodu- 
zent als auch als Quelle gemeinschaftlicher Erwartungen über „Männlichkeit“ 
und „Weiblichkeit“ wirksam ist. Durch das mediale Aufgreifen und Abbilden von 
konservativen Gender-Diskursen in den Morningshow-Moderationen werden 
diese stilisiert und wiederum gesellschaftlich zementiert. Die Ergebnisse machen 
zudem deutlich, dass die einseitige Besetzung der Funktionsrollen des Anchors 
und Sidekicks in den hierarchischen Moderations-Konstellationen ein stereotypes 
Geschlechterrollenbild manifestiert. 

Als problematisch ist zu werten, dass sich dieser Geschlechterrollen-Entwurf 
zu Ungunsten der dort arbeitenden Frauen auswirkt, indem ihnen stets die Rolle 
der Unterstützerin zukommt, während die „männlichen“ Moderatoren sich in der 
Rolle des Anchors als kompetente Experten in Szene setzen. Diese ungleiche Be- 
setzungspolitik stellt einen Ausschluss von Frauen aus Machtpositionen dar und 
offenbart eine misogyne Tendenz. Es ist allerdings zu betonen, dass die Konstel- 
lation „hierarchisch“ in einer Minderheit der im WWK untersuchten Sender vor- 
kommt. Auch anhand der gleichberechtigten Moderations-Konstellationen lässt 
sich die Tendenz einer einseitigen Besetzungspolitik erkennen, indem sich im ge- 
samten „Weihnachts- und Weltuntergangskorpus“ nur gleichgeschlechtlich 
„männlich“ besetzte Mehrfach-Moderationen nachweisen lassen, aber offenbar 
keine rein „weiblich“ besetzten Moderationsteams eingesetzt werden. Ergänzend 
zu einer qualitativen Auszählung der Besetzungsverhältnisse wäre es von Inte- 
resse, die Ebene der Planung und Inszenierung auf Seiten der Radioschaffenden 
zu untersuchen. So könnte danach gefragt werden, inwiefern eine genderisierte 
Besetzungspolitik intentional erfolgt und aus welchen Gründen Männern und 
Frauen bestimmte Positionen in der Moderation zugewiesen werden. 

Nicht allein die Geschlechtszugehörigkeit, sondern das Ausfüllen von sozialen 
Rollen prägt und verändert das Bild von „Männlichkeit“ und „Weiblichkeit“ in- 
nerhalb einer Gesellschaft, wie Heilmann (2004) zurecht anführt. Umso bedeut- 
samer ist daher, 


„[...] dass in allen sozialen Rollen, durch welche eine Gesellschaft repräsentiert 
wird, Frauen und Männer gleichberechtigt die Möglichkeit erhalten, an der Gestal- 
tung der jeweiligen Rollenbilder prägend mitzuwirken, um einseitige Geschlechts- 
zuschreibungen zu vermeiden.“ (ebd., 169-170). 


Bischoff und Wagner-Egelhaaf (2006) stellten fest, dass der vermehrte mediale 


Einsatz von Frauen in Moderationspositionen durchaus das Potenzial berge, zur 
Subversion der geschlechtlichen Dichotomie beizutragen: 
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„Indem Moderation in diesen Formaten in der doppelten Bedeutung des lateini- 
schen Wortes, nämlich zum einen im Sinne von ‚Mäßigung und Vermittlung‘, zum 
anderen aber auch im Sinne von ‚Lenkung und Herrschaft‘ zum Tragen kommt, 
verknüpfen sich [...] traditionell eher als ‚weiblich‘ konnotierte Fähigkeiten und 
Gesprächsstile mit ‚männlich‘ gedachten Führungsqualitäten [...].‘“ (ebd., 19). 


Durch den Einsatz von Frauen als Moderatorinnen von Polit-Magazinen im Fern- 
sehen habe sich die Wahrnehmung „öffentlich agierender und sich rhetorisch pro- 
filierender“ Frauen bereits stark verändert (vgl. ebd., 18). So würde die Auflösung 
des Gegensatzes von „männlichen“ und „weiblichen“ Redeorten und Redeweisen 
(hier beispielsweise „männlicher“ Anchor und „weiblicher“ Sidekick) auch im 
Radio die Chance bieten, „dass selbst scheinbar feststehende Kategorien, [...] in 
ihrer Veränderlichkeit und rhetorischen Verfasstheit erkennbar werden“ (vgl. 
ebd., 21). Das System der Zweigeschlechtlichkeit stellt keinen starren, unverän- 
derlichen Rahmen für Interaktionen zwischen Menschen dar, sondern birgt stets 
die Möglichkeit, Grenzverschiebungen vorzunehmen und aus konventionellen 
Rollenmustern auszubrechen. Umso relevanter erscheint es, dass identitätsstif- 
tende Massenmedien wie das Radio diese Möglichkeit der Grenzverschiebung 
und -auflösung aufgreifen und ihren Rezipierenden ein Angebot machen, welches 
durch mehr Diversität geprägt ist. 
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Stimmumfang und Sprechmelodie zur Markierung von 
„Weiblichkeit“ und „Männlichkeit“ in Radio-Morningshows 


Riccarda Funk, Jena 


Die vorliegende Untersuchung beschäftigt sich mit der Frage, ob Radiomodera- 
torinnen und Radiomoderatoren Stimmumfänge und Melodieverläufe als Mittel 
für typisch „weibliches“ und „männliches“ Sprechverhalten in Morningshows 
einsetzen. Es soll geklärt werden, ob der phonetisch messbare Stimmumfang und 
die akustisch hörbaren Melodievariationen bei Radiomoderatorinnen größer sind 
als bei Radiomoderatoren. Zudem wird der Einfluss des Senders auf die Stärke 
der Unterschiede untersucht. Hierzu wurden jeweils drei Moderationsabschnitte 
aus Morningshows eines Öffentlich-rechtlichen und eines privaten Senders über- 
prüft. 

Im Ergebnis zeigt sich, dass die verwendeten Stimmumfänge und Melodiever- 
läufe eher sender- als genderspezifisch sind. Obwohl der öffentlich-rechtliche 
Sender Genderkonstruktionen inhaltlich häufiger aufgreift, tritt die konkrete Be- 
nutzung klischeehafter Melodiemuster für die Untermauerung von Stereotypen 
nur selten auf. Im privaten Sender wurden zwar niedrigere Halbtonumfänge und 
kleinere Melodiesprünge für den Moderator gefunden, diese scheinen jedoch eher 
ein Zeichen für vordergründige Musikexpertise als für „männliches“ Sprechver- 
halten des Moderators zu sein, da sie nicht in Bezug zu Genderklischees stehen. 


1 Einleitung 


Männer und Frauen unterscheiden sich in ihrer Stimme und Sprechweise, wobei 
einige dieser Unterschiede biologisch bedingt, andere hingegen sozial gelernt 
sind. Anatomisch weisen Männer dickere und längere Stimmlippen auf, ihr La- 
rynx ist deutlich größer als der von Frauen (Titze 1989). Akustisch ergeben sich 
hieraus höhere Grundfrequenzen für Frauen, da die dünneren und kürzeren 
Stimmlippen schneller schwingen. In Gesprächen lässt sich bei deutschsprachigen 
Frauen eine mittlere Grundfrequenz von 217 Hz messen, Männer liegen mit 110 
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Hz deutlich tiefer (Herbst 1964, 129). Ähnliche Frequenzwerte ergeben sich auch 
für Amerikanisches Englisch (P£piot 2014; Sussman / Sapienza, 1994). Sozial ge- 
lernt scheinen hingegen der Stimmumfang und die Verwendung der Melodie in 
einer Äußerung (Variation der Grundfrequenz) zu sein. Frauen gelten im Ver- 
gleich zu Männern als melodiöser, sie verwenden beim Sprechen demnach einen 
größeren Stimmumfang. Dadurch wirken Frauenstimmen auf Hörer „verspielter, 
abwechslungsreicher und emotionaler“, Männerstimmen hingegen „ernster, ein- 
töniger und rationaler“ (Sendlmeier 2012, 102; ohne Angabe von empirischen Be- 
legen). 

Experimentell betrachtet stimmt die von Sendlmeier beschriebene Perzeption 
jedoch nicht immer mit Ergebnissen akustischer Analysen überein und hängt ent- 
scheidend von der Methode ab (Henton 1989). So ist die Angabe des Stimmum- 
fangs in der Einheit Hertz problematisch, weil die Änderung der Tonhöhe im Ver- 
gleich zur Frequenz nicht linear, sondern logarithmisch erfolgt (Pompino- 
Marschall 2009, 156). Deshalb empfiehlt sich für die Untersuchung des Stimm- 
umfangs eine Umrechnung in Halbtöne. Verwendet man diese Vergleichsme- 
thode, stellt sich (anders bei der Angabe in Frequenzumfängen) heraus, dass zwi- 
schen Männern und Frauen kaum akustisch messbare Unterschiede hinsichtlich 
des Stimmumfangs zu finden sind oder dass Männer sogar größere Stimmum- 
fänge nutzen (Henton 1989). Herbst (1964) gibt in einer frühen Arbeit bei deut- 
schen Gesprächen im Mittel 5 Halbtöne für Frauen und 7 Halbtöne für Männer 
an. In gelesenen Wörtern misst Pépiot (2014) 6,8 Halbtöne für Frauen und 5,4 
Halbtöne für Männer französischer Muttersprache, im amerikanischen Englisch 
liegen beide Geschlechter mit etwa 5,9 Halbtönen noch näher beieinander. Für 
Radionachrichten zeigen Grawunder et al. (2006) zwar höhere Halbtonumfänge 
als für Gespräche, aber auch hier sind die Werte mit 10-20 Halbtönen (Frauen) 
bzw. 10-19 Halbtönen (Männer) ähnlich. Allerdings lässt sich bestätigen, dass 
Frauen in geschlossenen und deklarativen Fragen häufiger interrogative Melodie- 
muster verwenden als Männer, was die emotionalere Wirkung erklären könnte 
(Haan / Van Heuven 1999). 

Die von Sendlmeier (2012) aufgegriffenen Stimmklischees spiegeln die Erwar- 
tungen von typisch „männlichen“ und „weiblichen“ Eigenschaften beim Sprechen 
wider. Da sie im Gegensatz zu biologisch bedingten Larynxunterschieden sozial 
konstruiert sind, sind sie aber weniger als geschlechts-, sondern eher als gender- 
spezifisch zu werten (Aulenbacher et al. 2010). Gender spielt auch im Radio eine 
wichtige Rolle. Es wird beispielsweise in Morningshows verschiedener Radio- 
sender vielfach inszeniert und trägt damit einen wichtigen Teil zur Festigung von 
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Geschlechterrollenbildern bei (Galonski 2017, vgl. auch Finke 2019 und Ga- 
lonski / Finke in diesem Band). Die Morningshows werden im Radio zur hörer- 
stärksten Sendezeit zwischen 7 und 9 Uhr morgens gesendet (Bose / Finke 2016, 
67) und erreichen damit ein großes Publikum. Sie sollen vor allem unterhalten 
und werden in der Regel von mindestens zwei Personen moderiert. Die jeweiligen 
Moderierenden haben dabei zwei wichtige Aufgaben: Zum einen sollen sie die 
Identität des Senders und des Programms repräsentieren, zum anderen sollen sie 
in ihren Moderationen möglichst individuell bleiben, um viele Hörergruppen an- 
zusprechen. Dafür ist ein authentisch wirkender Sprach- und Sprechstil von gro- 
Ber Bedeutung (ebd., 67 £.). 

Wenn man die Variation der Grundfrequenz als sozial gelernten Parameter be- 
trachtet, stellt sich die Frage, ob Stimmumfänge und Melodieverläufe bei Gend- 
erinszenierungen im Radio gezielt eingesetzt werden. Möglicherweise werden sie 
als Marker für typisch „weibliches“ und „männliches“ Sprechverhalten verwen- 
det, um die Authentizität der Moderierenden zu erhöhen und für eine Identifika- 
tion bei den jeweiligen Hörergruppen zu sorgen. Aus dieser Fragestellung ergeben 
sich drei zu untersuchende Hypothesen: 


1. In Morningshows verwenden Radiomoderatorinnen einen größeren Stimm- 
umfang als Radiomoderatoren. Das heißt, akustisch ist die Differenz aus 
maximaler und minimaler Tonhöhe bei Moderatorinnen größer. 

2. In Morningshows verwenden Radiomoderatorinnen eine variationsreichere 
Sprechmelodie als Radiomoderatoren. Auditiv sind bei Moderatorinnen 
häufiger Veränderungen der Tonhöhe in Folgesilben wahrnehmbar. 

3. Die Ergebnisse aus Hypothese 1 und 2 sind abhängig vom untersuchten 
Sender. Bei Sendern, die oft auf Genderklischees referieren, ist der Unter- 
schied zwischen Radiomoderatorinnen und Radiomoderatoren größer als 
bei solchen, die Genderklischees kaum aufgreifen. 


Um diese Hypothesen zu überprüfen, wurden Stimmumfänge der Radiomodera- 
torinnen und Radiomoderatoren aus einem Teil des sogenannten „Weihnachts- 
und Weltuntergangskorpus“ von Finke (2014) sowohl akustisch gemessen als 
auch auditiv bewertet und miteinander verglichen. 


2 Methode 


Grundlage der Untersuchung ist das sogenannte „Weihnachts- und Weltunter- 
gangskorpus“ von Finke (2014). In diesem Korpus sind Radiomitschnitte vom 18. 
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bis 24. Dezember 2012 von insgesamt 78 Sendern enthalten. Namensgebend für 
das Korpus sind die zwei zentralen Themen des Erhebungszeitraums — Weihnach- 
ten und das Ende des Maya-Kalenders. Einen Teil dieses Korpus hat Galonski 
(2017) auf die Verwendung von Gender-Konstruktionen untersucht (vgl. auch 
Galonski / Finke in diesem Band). Hierfür wurden die Doppelmoderationen von 
sechs Sendern gesprächsanalytisch überprüft. 

Für die vorliegende Analyse wurden zwei der sechs Sender aus Galonskis Teil- 
korpus herausgegriffen, die folgende Bedingungen erfüllen: Die Moderierenden 
haben gleichberechtigt angelegte Funktionsrollen; ausgeschlossen bleiben hierar- 
chische Moderationen, da die „Sidekicks“ (d. h. Nebenmoderator*innen) im Ver- 
gleich zum „Anchor“ (d. h. Hauptmoderator) zu wenig Redeanteile besitzen. Zu- 
dem sollen sowohl ein Mann als auch eine Frau moderieren, um Differenzen im 
Stimmumfang und der Melodieführung feststellen und damit die 1. und 3. Hypo- 
these überprüfen zu können. Diese Bedingungen treffen auf zwei der sechs Sender 
zu: Bei Sender 5 handelt es sich um einen öffentlich-rechtlichen Sender, die Mit- 
schnitte stammen vom 19.12.2012 (7.00 bis 9.00 Uhr). Sender E2 ist ein privater 
Sender, die untersuchten Aufnahmen stammen vom 21.12.2012 (ebenfalls 7.00 
bis 9.00 Uhr). In beiden Sendern findet Galonski (2017; vgl. auch Ga- 
lonski / Finke in diesem Band) bezüglich der Inszenierung von Gender verschie- 
dene Ergebnisse. Genderklischees werden im Sender 5 mehrfach explizit genannt. 
Die Persönlichkeiten der Moderierenden werden vor allem in den Zwischenmo- 
derationen genderspezifisch aufgegriffen und damit voneinander abgegrenzt. An- 
ders verhält es sich bei Sender E2. In diesem werden die Persönlichkeiten der 
Moderierenden generell nur wenig inszeniert. Im Vordergrund steht das Sprechen 
über aktuelle Musik, die Moderierenden treten als Experten und Expertinnen auf. 
Das musikalische Format dieses Senders ist zielgruppenspezifischer als das des 
Senders 5, der sich eher als „Mainstream“-Sender darstellt und eine breite Hörer- 
schaft ansprechen möchte (Galonski 2017, 47). Somit unterscheiden sich die Sen- 
der hinreichend voneinander, um die zweite Hypothese untersuchen zu können. 

Die Bestimmung der Grundfrequenzwerte ist aufgrund der Hintergrundmusik 
nur bedingt möglich. Allerdings sind die für die Analyse ausgesuchten Aus- 
schnitte aus Sender 5 und Sender E2 an den meisten Stellen nur mit leiser Musik 
unterlegt, was die Untersuchung aufgrund weniger Störgeräusche vereinfacht. Die 
Ausschnitte folgen zeitlich fast unmittelbar aufeinander. Jeder Ausschnitt wurde 
zunächst mit dem Soundanalyseprogramm Praat (Boersma / Weenink 2017) an- 
notiert, um ihn anschließend auditiv analysieren zu können. Hierfür wurden die 
gesprochenen Satzteile in Praat zunächst orthographisch transkribiert. Ein Satz- 
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abschnitt endete immer dann, wenn die Moderierenden eine hörbare Pause mach- 
ten. Anschließend wurden die Satzteile, die vom Moderator gesprochen wurden, 
in Wörter gegliedert und schließlich in Silben. Die darunterliegenden Ebenen be- 
inhalteten äquivalent dazu die gesprochenen Wörter und Silben der Moderatorin. 
Für eine möglichst nachvollziehbare auditive Analyse wurde für jede Silbe die 
Tonhöhe in Relation zum verwendeten Tonhöhenumfang markiert: Zahlenwert 1 
bezeichnet die tiefste wahrgenommene Tonhöhe; Zahlenwert 7 bezeichnet die au- 
ditiv als am höchsten wahrgenommene Tonhöhe. Für dazwischenliegende Ton- 
höhenwahrnehmungen wurden entsprechend die Zahlenwerte 2 bis 5 notiert. Zu- 
dem wurde in jedem Silbenabschnitt die Melodiebewegung durch einen Pfeil 
gekennzeichnet, der anzeigt, ob die Melodie der Silbe im Vergleich zur folgenden 
Silbe ansteigt 1, abfällt | oder gleichbleibt >. Am Ende eines Satzabschnitts zeigt 
der Pfeil somit an, ob die Satzmelodie steigend, fallend oder progredient ist (siehe 
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Abb. 1: Darstellung der Annotationsweise in den erstellten TextGrids der Audioaufnahmen 
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Mithilfe dieses Annotationssystems ist es möglich, Aussagen über den Melodie- 
verlauf und Stimmumfang der Moderierenden zu treffen: Wenn die Melodie in 
vielen Folgesilben gleichbleibt, wirkt die Sprechweise monotoner, als wenn sie 
sich oft verändert. Werden oft Grenzwerte wie 1, 2, 6 und 7 vergeben, spricht das 
für einen auditiv großen Stimmumfang. Dieses System ist angelehnt an Pike 
(1946) und Wells (1945), die in ähnlicher Weise an die Beschreibung der Prosodie 
des amerikanischen Englisch herangehen. Allerdings werden dort nur Werte von 
1 bis 4 vorgeschlagen, was sich für eine exaktere Melodiebeschreibung als zu un- 
genau herausgestellt hat. Für die vorliegende Analyse sollen mehr Zahlenwerte 
differenziertere Beschreibungen ermöglichen. Die Zahlen 1 bis 7 haben sich für 
diese Untersuchung als gute Spanne erwiesen. 
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Zur Berechnung der Gesamtwerte wurden nur die Silben des Moderierenden 
gezählt, der den Gesprächsturn innehatte. Zwischenrufe wie „wuhu“ sind weniger 
aussagekräftig, da sie von vornherein extremere Melodieverläufe aufweisen, und 
wurden deshalb ignoriert. Auch wenn das Hauptaugenmerk auf der auditiven 
Analyse lag, wurden zusätzlich akustische Messungen mit Praat vorgenommen. 
Diese erfolgten jedoch nur halbautomatisch. In jedem Satzabschnitt wurden er- 
kennbare Messfehler eliminiert, indem der betreffende Abschnitt auf „stumm“ 
gesetzt wurde (siehe Abbildung 2). Die schwarze Linie in der Abbildung stellt 
den Melodieverlauf dar. Die roten Pfeile weisen auf zu eliminierende Messfehler 
hin — hier wird eine Grundfrequenz stimmloser Laute durch unterlegte Musik ge- 
messen. Anschließend wurden die Grundfrequenz des Abschnitts sowie höchster 
und niedrigster Grundfrequenzwert ermittelt. Der sich daraus ergebende Stimm- 
umfang wurde mit folgender Formel berechnet (Mayer 2017, 142): 


12 fmax 


St = RO Gan 


) 


Aus diesen Messungen der einzelnen Abschnitte wurden Mittelwerte der Sprecher 
und Sprecherinnen gebildet, um Messfehler weiter zu minimieren. Für einige 
(sehr kurze) Abschnitte konnten keine Werte berechnet werden. 
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Abb. 2: Beispiel für die Messung der Grundfrequenzen in Praat 


In der Durchführung beider Methoden haben sich teilweise Diskrepanzen zwi- 
schen der auditiven Wahrnehmung und den akustischen Messungen gezeigt. 
Diese machen deutlich, dass der in Halbtonschritten ausgedrückte Stimmumfang 
nicht zwangsläufig etwas über die Wirkung von Melodiösität aussagt. Um Stimm- 
umfang und Sprechmelodie adäquat beschreiben zu können, ist die Kombination 
beider Methoden deshalb sinnvoll. 

Die Audios zu den im Beitrag behandelten Beispielen (Transkripten) sind ver- 
fügbar über den QR-Code zu Beginn des Artikels bzw. unter: 

https://cloud.uni-halle.de/s/RiNcyv9SpNBwGwd. 
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3 _ Ergebnisse 


3.1 Sender 5 (öffentlich-rechtlicher Sender) 


Moderationsabschnitt 1: Der erste untersuchte Moderationsabschnitt des Sen- 
ders 5 weist inhaltlich unterschiedliche Thematiken auf. Zunächst wird ein Ge- 
winnspiel beworben, anschließend werden Musiktitel angekündigt und Gerüchte 
über den Sänger „Olly Murs“ ausgetauscht. Schließlich leitet der Moderator zu 
den Nachrichten über (Transkription orientiert an GAT2, Selting et al. 2009; EV 
= vorproduzierte Elemente, z. B. Jingle, Musikbett, M1+M2 = Moderator*innen). 


001 M2: KINder KInder; | | 

002 es is noch nich mal sieben UHR-| 

003 un die erste Xbox hat HEUte bei UNS in der MORningshow 
bereits den beSITZer [gewechSELrT, |] 

004 M1: [whuHU ] 

005 M2: das WA:RS auch noch nich, | 

006 denn es geht WEIte:r- || 

007 M1: hm wenn also unser geBRÜLLtes gedicht läuft-| 

008 ANrufn null achtHundert- | 

009 eins zwei drei zwo DREI vier NULL, | 

010 viel GLÜCK, | 

011 UND- | 

012 guten MORgen; | 

013 hier ist (( Name Sender 5))|| 

014 in der NÄKSten halben Stunde, | 

015 die beste musik von HEUte-| 

016 LEna- | 

017 und STAR dust. || 

018 EV: Musik wird eingespielt 

019 M2: O:1ly Murs; 

020 hat ein ANgebot beKOMM sich O:ben O:Hne ablichtn zu 
lassn, | 

021 ((seufzt)) 

022 [er hat es aber ABgelehnt. ||] 

023 Mi: [((stöhnt)) ] 

024 M2: ich hätts ANgenomm- | 

025 aber ich hab ja auch keins beKOMM- | 

026 [NAja gut eGAL; |] 

027 Mis [((lacht)) ] 

028 M2: jedenfalls HEART skips a BEAT- | 

029 GLEICH bei UNS; || 

030 EV: Musik wird eingespielt 

031 M1: UND der WEIHnachtskultklassiker-| 

032 der KOMMT- | 

033 für ECHte ABwechslung von-| 

034 BRYAN Adams. | | 

035 CHRISmastime. | | 

036 EV: Musik wird eingespielt 


Transkript 1: Sender 5, Moderationsabschnitt 1 (Audio 1) 
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Beim Anhören des Sprechers fällt auf, dass er zunächst sehr tief und mit knarren- 
der Stimmqualität beginnt. Im Verlauf der Moderation wird seine Stimme konti- 
nuierlich höher, die Grundfrequenz wird stark variiert. Auditiv werden mehrheit- 
lich Werte von 3 bis 7 vergeben. Besonders auffällig erscheint das Wort „lassen“ 
im Satz „Olly Murs hat ein Angebot bekommen, sich oben ohne ablichten zu las- 
sen“. Hier beginnt die erste Silbe tief bei etwa 88 Hz (Wert 2), die zweite Silbe 
endet sehr hoch bei etwa 442 Hz (Wert 7). Der Tonhöhenumfang innerhalb dieses 
Wortes beträgt damit 28 Halbtöne (über zwei Oktaven). Bei der Analyse der Fre- 
quenzwerte ist zu beachten, dass hochfrequente Musik unter der Aufnahme liegt 
und die tatsächliche Tonhöhe des Sprechers abweichen kann. Doch auch in den 
sehr eng werdenden Abständen der Glottisschläge im Sonagramm ist der Fre- 
quenzunterschied sichtbar und rein auditiv erscheint der Sprung ebenfalls extrem 
(siehe Abbildung 3). 
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Abb. 3: Sender 5 — Tonhöhensprung im Wort <lassen> des Sprechers 


Etwas weniger melodiös klingt der Sprecher bei der Überleitung zu den Nachrich- 
ten. Im Vergleich zu den vorigen sehr beschwingten Sprechausdrucksmustern 
wirkt er nun zwar ernster, aber keinesfalls monoton. Auditiv reicht die Spanne 
von 1 bis 5. Der Sprechausdruck der Sprecherin wirkt im ersten Moderationsab- 
schnitt ebenfalls durchgängig melodiös. Zudem klingt ihre Stimme sehr hoch und 
fröhlich, es ist eine für Radiomoderationen charakteristisches „smiley voice“ 
(Bose / Finke 2016, 74) zu hören. Das zeigt sich besonders in der Nennung der 
Gewinnspieltelefonnummer und in der Nennung des Sendernamens. Auditiv be- 
west sich das Melodiemuster zwischen Werten von 2 bis 7. In der Ankündigung 
eines „Weihnachtskultklassikers“ ist die Stimme sehr tief und klingt dabei etwas 
behaucht. 
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Moderationsabschnitt 2: Im zweiten untersuchten Moderationsabschnitt wird 
ein Thema gezielt mit Genderklischees aufgeladen. Der Moderator fragt die Mo- 
deratorin, warum man auf den Weihnachtsmarkt gehe. Diese antwortet: „Wegen 
dem Glühwein [sic], der Atmosphäre“ und wird daraufhin von ihrem Moderati- 
onspartner unterbrochen. Dieser meint, als Single-Mann gehe man auf den Weih- 
nachtsmarkt, um „Frauen kennenzulernen“. 


001 M2: GUten MO:Rge:n?| | 

002 Mi: FÜNF nach SIEben is es-|| 

003 M2: WArum- | 

004 geht man auf den WEIHnachmarkt, | 

005 Ml: wegen dem GLÜHwein- | 

006 [der atmosPHÄre; | ] 

007 M2: [JAjajajaja |] 

008 oder als SINGelmann um FRAUN [kennzulern- | ] 
009 M1: [((lacht)) ] 
010 M2: und welche TRICKS da ANgewendet werden, | 
011 das hörn wir in sechs miNUten | 

012 HIER bei UNS-| | 

013 in der MORningshow- | 

014 ALso um-| 

015 elf nach SIEben. | | 

016 EV: Beitrag wird eingespielt 


Transkript 2: Sender 5, Moderationsabschnitt 2 (Audio 2) 


Der Sprecher wirkt wie zuvor sehr melodiös. In der Begrüßung zeigt sich im Wort 
„Morgen“ ein ähnlich starker Melodiesprung wie im Wort „lassen“ des ersten 
Moderationsabschnitts, diesmal sogar vom auditiv ermittelten tiefsten Wert 1 (ge- 
knarrte Stimmqualität) bei 90 Hz zu einer extremen Höhe (Wert 7) bei 483 Hz. 
Der Stimmumfang beträgt 29 Halbtöne (siehe Abbildung 4). Die Tonhöhe in der 
Frage nach den Zielen auf dem Weihnachtsmarkt kann insgesamt als hoch bewer- 
tet werden und endet mit steigendem Melodiemuster auf dem Wert 7, dabei klingt 
die Stimme des Sprechers eng und gepresst. Bei der Unterbrechung seiner Kolle- 
gin, die „typisch weiblich“ von Glühwein und Atmosphäre schwärmt, wirkt der 
Sprecher etwas belustigt und leicht überheblich. Seine Sprechstimmlage ist hier 
zwar insgesamt etwas tiefer, der Tonhöhenverlauf dennoch melodiös. Die Spre- 
cherin weist hier ebenfalls viele Melodiesprünge auf. In ihrer Aussage „Wegen 
dem Glühwein [sic], der Atmosphäre“ spricht sie insgesamt sehr hoch. Auditiv 
werden Werte von 3 bis 7 vergeben. Die letzte Silbe dieser Sprecheinheit endet 
mit progredientem Melodieverlauf. Dies zeigt, dass die Aussage der Moderatorin 
noch nicht abgeschlossen ist, als sie unterbrochen wird. Sie beginnt zu lachen, als 
ihr Moderationspartner von der Möglichkeit spricht, Frauen auf dem Weihnachts- 
markt kennenzulernen. Damit hat sie in diesem Moderationsteil eher die Wirkung 
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eines „Sidekicks“ als einer gleichberechtigten Moderatorin — sie lässt sich unter- 
brechen und bestätigt ihren Kollegen mit einem Lachen. 
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Abb. 4: Sender 5 — Tonhöhensprung im Wort „Morgen“ des Sprechers 


Moderationsabschnitt 3: Der dritte untersuchte Moderationsabschnitt schließt 
thematisch an den zweiten an (siehe Transkript). Zunächst begrüßt die Moderato- 
rin die Hörerschaft und nennt beispielhaft verschiedene Regionen aus dem Sen- 
debereich. Ein besonderer Gruß geht dabei nach Magdeburg, da in dieser Stadt 
bereits Weihnachtsferien sind. Der Moderator bezeichnet die Weihnachtsmärkte 
der größeren Städte als „weihnachtlichen Hotspot“. Die Ergänzung der Modera- 
torin ist ähnlich wie im zweiten Abschnitt: „Weil man sich vom Shopping-Stress 
erholen kann, weil man Glühwein trinken kann“. Dabei referieren der „Shopping- 
Stress“ und das Glühweintrinken auf Klischees von „weiblichen“ Aktivitäten auf 
dem Weihnachtsmarkt. Der Moderator ergänzt die Klischees der „männlichen“ 
Möglichkeiten mit „ja, und weil man dort auch hervorragend Frauen kennenler- 
nen kann, hab‘ ich gehört, ob das wirklich klappt“. Das wird von der Moderatorin 
mit einem übertrieben wirkenden hohen Lachen und der ironisch klingenden Aus- 
sage „ja, genau“ untermalt. 


001 M1: elf nach SIEben; | 

002 die ((Name Sender 5)) MORningshow- | 

003 gutn MORgn in die ((unverständlich)) stadt 
RUHla nach west THüringen- | 

004 nach PULZnitz in der oberlausitz- | 

005 O:der gutn MORgen in DIE stadt in der schon 
wEIHnachtsferien sind- | 

006 die LANdeshauptstadt von sachsen ANhalt- | 

007 gutn MORgen nach MAGdeburg; | 

008 M2: gu:tn MORgen- | 

009 der weihnachtliche HOTspot in diesen TAgen S::IND 
natürlich im augenblick die WEIHnachtsmärkte- | 

010 IN den größeren STÄdtn: +? || 

011 Mi; WEIL man sich vom SHOPpingstress erholen kann- | 

012 weil man GLÜH: wein trinken kann- ||= 

013 M2: ja und (.) weil man DORT auch herVORragend FRAUen 
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kennenlernen kann; | 


014 [HAb ich geHÖRT- || ] 

015 M1: [genau || ] 

016 M2: [ob DAS wirklich KLAPPT- | ] 
017 M1: [((kichert)) ] 
018 M2: die ungeschönte WAHRheit- | 
019 JETZT; || 

020 EV: Beitrag wird eingespielt 


Transkript 3: Sender 5, Moderationsabschnitt 3 (Audio 3) 


Hierin zeigt sich, dass „in der Persönlichkeitsinszenierung der Moderierenden 
‚Doing Gender‘ eine große Rolle zu spielen scheint, indem häufig auf explizit- 
thematischer Ebene stereotype geschlechtsassoziierte Zuschreibungen und gend- 
erisierte Klischees bemüht werden. Die Inszenierung der Moderatoren-Persona- 
lity wird mit der Darstellung dichotomer geschlechtlicher Identitäten verknüpft, 
wodurch eine typisierte Portraitierung der Geschlechter entsteht“ (Ga- 
lonski / Finke in diesem Band). In den Frequenzmustern der Sprecherin fällt auf, 
dass die Begrüßung der Hörerschaft sehr melodisch und insgesamt sehr hoch ist. 
Dies wird durch das durchgängige Benutzen der „smiley voice“ verstärkt. Die 
Sprecherin bewegt sich bei auditiven Werten von 2 bis 7. Bei der Nennung der 
typisch „weiblichen“ Aktivitäten auf dem Weihnachtsmarkt klingt sie noch höher 
als zuvor. Die höchste Frequenz weist die betonte erste Silbe des Wortes „Glüh- 
wein“ auf, hier werden 477 Hz (Wert 7) gemessen (siehe Abbildung 5). 
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Abb. 5: Sender 5 — Melodieverlauf der Sprecherin im ersten Teil der Begrüßung „Elf nach 
sieben, die *Sender 5* Morningshow, guten Morgen in die Uhrenstadt Ruhla nach 
Westthüringen, nach Pulsnitz in der Oberlausitz oder guten Morgen in die Stadt, 
in der schon Weihnachtsferien sind“ 


Der Moderator klingt zu Beginn der Moderation ähnlich melodiös wie die Mode- 
ratorin. Es werden auditive Werte von 1 bis 7 vergeben. Im letzten Wort „Städten“ 
zeigt sich dasselbe Muster wie in den Äußerungsenden der vorigen Moderations- 
abschnitte: Die erste Silbe ist erneut sehr tief und geknarrt (Wert 1), die zweite 
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Silbe hat auditiv den höchsten Wert 7. Akustisch bewegt sich der Sprecher in die- 
sem Wort zwischen 59 und 351 Hz. Das ergibt einen sehr hohen Tonhöhenumfang 
von etwa 31 Halbtönen. Im Kontrast dazu steht das Melodiemuster in der Aussage 
„Ja, und weil man dort auch hervorragend Frauen kennenlernen kann“. Hier wirkt 
der Sprecher deutlich tiefer und monotoner. Es werden sehr oft die Werte 1 und 2 
vergeben, lediglich am Ende des Teilsatzes bewegt sich die Melodie in höhere 
Frequenzbereiche (siehe Abbildung 6). Hier zeigt sich zum ersten Mal ein direkter 
Zusammenhang zwischen genderisierten Klischees und eingesetztem Stimmum- 
fang: Die Moderatorin zählt die „weiblichen“ Stereotype in hoher und melodiöser 
Weise auf, der Moderator wirkt bei der Nennung der „männlichen“ Stereotype 
viel tiefer und monotoner als sonst. 
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Abb. 6: Sender 5 — Melodieverlauf des Sprechers in der Aussage „Ja, und weil man dort auch 
hervorragend Frauen kennenlernen kann, hab ich gehört, ob das wirklich klappt“ 


Insgesamt können in den drei untersuchten Abschnitten des Senders 5 bei der Mo- 
deratorin 193 Silben gezählt werden, der Moderator hat mit 254 Silben den höhe- 
ren Redeanteil. 9,84% der gesprochenen Silben des Sprechers bekommen den 
Wert 1 (sehr tief), 17,32% den Wert 2 (tief). Bei der Sprecherin beträgt die relative 
Häufigkeit des Wertes lediglich 1,55%, die relative Häufigkeit des Wertes 2 
8,81%. Darin zeigt sich, dass der Moderator deutlich häufiger den tiefen Tonhö- 
henbereich seiner Stimme nutzt als seine Moderationspartnerin. Die hohen Werte 
sind bei beiden Moderierenden ähnlich verteilt. Mit 9,33% gegenüber 7,09% wird 
der Wert 6 für die Moderatorin etwas häufiger vergeben als für den Moderator, 
der Wert 7 ist mit 3,63% zu 3,54% fast identisch vertreten. Vergleicht man die 
Anzahl der Pfeile, die für einen gleichbleibenden Tonhöhenverlauf folgender Sil- 
ben stehen, mit denen, die eine Veränderung der Tonhöhe ausdrücken, spricht die 
Moderatorin mit 52,85% etwas „monotoner“ als der Moderator mit 47,24%. Den- 
noch zeigt sich in diesen Werten kein allzu großer Unterschied zwischen Sprecher 
und Sprecherin (siehe Tabelle 1). 
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Silbenanzahl | Wert1 | Wert2 | Wert6 | Wert7 | Melodie | Melodie 
(gesamt) = N 
193 3 17 18 7 102 91 
Frau (100%) (1,55%) | (8,81%) | (9,33%) | (3,63%) | (52,85%) | (41,15%) 
254 25 44 18 9 120 134 
Mann (100%) (9,84%) | (17,32%) | (7,09%) | (3,54%) | (47,24%) | (52,76%) 


Tab. 1: Auditive Bewertung der Moderierenden im Sender 5 — Tonhöhe und Melodie 


Betrachtet man den Mittelwert aller messbaren durchschnittlichen Grundfrequen- 
zen der Satzteile, liegt die Sprecherin mit 200,83 Hz höher als der Sprecher mit 
146,21 Hz. Damit befindet sich die Sprecherin im Rahmen des physiologischen 
Hauptsprechtonbereichs, den Herbst (1964) für ihre Analyse angibt, der Sprecher 
liegt leicht darüber (vgl. ebd. 152). Der Mittelwert der gemessenen minimalen 
Frequenzen aller Satzabschnitte beträgt bei der Moderatorin 124,62 Hz und beim 
Moderator 63,27 Hz, die maximalen Frequenzen betragen 369,81 Hz (Moderato- 
rin) bzw. 307,18 Hz (Moderator). Damit ergibt der berechnete Stimmumfang 
18,83 Halbtöne für die Moderatorin, der des Moderators ist deutlich größer und 
beträgt 27,35 Halbtöne (siehe Tabelle 2). Nach diesen Zahlen liegt der Stimmum- 
fang der Sprechstimme des Moderators sowohl über den Werten des Umfangs 
einer durchschnittlichen Singstimme von Herbst (1964, ebd.) als auch über den 
Werten in Radio-Nachrichten (Grawunder et al. 2006), er umfasst über zwei Ok- 
taven. Hierbei ist natürlich zu beachten, dass vor allem die Messung der sehr ho- 
hen und tiefen Grundfrequenzwerte durch die Aufnahmequalität beeinflusst sein 
kann. 


FO © F0 FOmin OFOmin FOmax OFOmax Stimmumf. 

[Hz] [Hz] [Hz] [Hz] [Hz] [Hz] [Ht.] 
Frau | 200,83 | 38,32 124,62 44,06 369,81 104,9 18,83 
Mann 146,21 | 29,32 | 6327 | 17,74 | 307,18 | 88,01 27,35 


Tab. 2: Akustische Analyse der Moderierenden im Sender 5 — Frequenz und Halbtonumfänge 


3.2 Sender E2 (privater Sender) 


Moderationsabschnitt 1: Thematisch dreht sich der erste untersuchte Moderati- 
onsabschnitt des Senders E2 zunächst um den Stress bei den bevorstehenden 
Weihnachtseinkäufen sowie um die Ankündigung eines verkaufsoffenen Sonn- 
tags in verschiedenen Städten. Anschließend wird die Party „Nightmare before 
Christmas“ in Magdeburg beworben, die am kommenden Tag stattfinden soll. 
Auffällig ist, dass die Themen „Shopping-Stress“ und „Partybesuch‘“ nicht mit 
Genderklischees aufgeladen werden, anders als bei Sender 5. Im vorliegenden 
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Ausschnitt wird beides nicht auf ein bestimmtes Rollenbild bezogen. Lediglich 
die Bezeichnung von Weihnachten als „Heidschibumbeidschikram“ des Modera- 
tors kann implizit genderisiert aufgefasst werden, da es der männliche Sprecher 
ist, der dies anführt — dem Klischee nach tendieren Männer eher als Frauen dazu, 
Weihnachten kitschig zu finden. Da die Sprecherin aber ironisch über den „Spaß“ 
beim Einkaufen im Trubel spricht, wird dieses Rollenbild wieder entkräftet. 


001 
002 
003 
004 
005 


006 
007 
008 
009 
010 
011 


ei = = oe O 
u 


020 
021 


022 
023 
024 
025 
026 


027 
028 
029 


030 
031 
032 
033 


M1: 


M2: 


M1: 


M2: 


M1: 
M2: 


Mi: 


EV: 


FREItag- | 

MORgen- | 

SECHS- | 

vor ACHT; | 

wer HEUte nich im STAU auf der AUtobahn steht oder 
sich von der ((unverständlich)) | 
WEIHnachtsMENschenMENGe- | 

durch die KAUFhäuser schieben lassen will, | 

DER machts doch einfach- | 

ORgn, | 

oder SONNtag, | 

denn DA is noch VIEL MEHR los und da machts DOPPelt so 
viel SPAR-| 

DENN es is verKAUFSoffener SONNtag unter anderem in 
DESsau- 
AGdeburg, | 
LEIPzig, | 
WERnigerode; | 

UND HALle. | | 

Oder ihr habt da jetz schon die schautze VOLL von 
WEIHnachten und dem ganzn HEIdschibumBEIdschiKRAM, | 
DANN seid ihr morgn in der MARKThalle in MAGdeburg mit 
[dabei- ] 

[((kichert))] 

NIGHTmare before CHRISTmas; | 

DAS is ne PARty auf ders nich beSINNlich sondern LAUT 
wird- | 

mit LIVEbands aus dem ROCK un eLEKtropopbeREICH, 
[heiße ENGel] tanzen dann noch für euch- | 

[hm_hm | ] 

gibt ne tolle kuLllsse- | 

geile BANDS un n UNvergesslicher Abend vieLLEICHT ja 
auch noch ne beSCHERung, | 
MORgn ab ZWANzig uhr in der MARKThalle SUdenburg- | 
EINtritt kostet euch ZWÖLF EUro an der Abendkasse. | | 
und wir Üben jetz schonma wie das ganze funktioNIERT 
mit dem TANzen und zwar mit-| 

DER König TANZT- | 

der König TANZT mach AN; | 

und LAUT. | 

Musik wird eingespielt 


Transkript 4: Sender E2, Moderationsabschnitt 1 (Audio 4) 
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Stimmlich fällt insgesamt auf, dass beide Moderierenden des Senders E2 tiefer 
sprechen und monotoner wirken als diejenigen des Senders 5. Die Moderatorin 
beginnt ihre Begrüßung sehr tief. Die folgenden Satzteile befinden sich maximal 
auf den Werten 4 und 5 und wirken damit ebenfalls tief gesprochen. Die ironische 
Begründung, lieber am Sonntag die Weihnachtseinkäufe zu erledigen — „Denn da 
ist noch viel mehr los und da macht‘s doppelt so viel Spaß“ — klingt deutlich höher 
und melodiöser als die vorangegangenen Abschnitte und bewegt sich auditiv zwi- 
schen den Werten 3 und 7. Die höchste Frequenz erreicht das Wort „viel“ mit 440 
Hz (siehe Abbildung 7). 
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Abb. 7: Sender E2 — Tonhöhenverlauf im Ausschnitt „viel mehr los“ der Sprecherin 


Die Aufzählung der Städte, in denen es einen verkaufsoffenen Sonntag gibt, klingt 
ebenfalls melodiös und es werden Werte zwischen 1 und 6 notiert. Da bei dieser 
Moderatorin keine starke „smiley voice“ zu hören ist, wirkt die Aufzählung ent- 
spannter als bei der Moderatorin des Senders 5. Der Moderator klingt im gesam- 
ten Abschnitt tiefer und monotoner als die Moderatorin und auch als der Sprecher 
des Senders 5 (alle vergebenen Werte liegen unter 5). Im Mittel bewegt sich der 
Sprecher bei einer Grundfrequenz von 125 Hz, der höchste messbare Wert liegt 
bei 240 Hz. Der Stimmumfang beträgt hier etwa 11 Halbtöne. Die monotonen 
Melodieverläufe wirken vor allem sachlich, da sich beide Moderierenden „in den 
Gesprächen gleichermaßen und geschlechtsunabhängig als kompetente Ex- 
pert*innen und humorvolle Gastgeber*innen inszenieren können“ (Ga- 
lonski / Finke in diesem Band). Bei der Beschreibung der Magdeburger Party gibt 
die Moderatorin einmal ihre Zustimmung mit „hmh“. Das geschieht in niedrige- 
ren Frequenzen als die Zustimmungen der Moderatorin im Sender 5. Dadurch 
wirkt sie an dieser Stelle ebenso kompetent wie ihr Moderationspartner. 


Moderationsabschnitt 2: Im zweiten Moderationsabschnitt des Senders E2 wird 
auf das Ende des Maya-Kalenders verwiesen. Im Kontrast zum möglichen 
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Weltende werden von der Moderatorin positive Dinge genannt, die im kommen- 
den Jahr passieren könnten. Der Moderator ergänzt ein für ihn weniger positives 
Ereignis aus dem Themenbereich Fußball. Anschließend werden viele Musik- 
bands genannt, die im kommenden Jahr neue Alben veröffentlichen. Der Verweis 
hierauf macht zeitlich etwa die Hälfte des Abschnitts aus und zeigt, dass das Spre- 
chen über Musikthemen eine Besonderheit dieses Senders ist (vgl. Galonski 2017, 
99). 


001 M1: und DAmit ist es VIER nach ACHT-| | 

002 SCHÖNen guten MORgen- | = 

003 =hier sind FRANzi und THOmas; | | 

004 M2: SCHÖNen guten MORgen- | 

005 und WENN wir den HEUtigen TAG überLEben 
sollten- | 

006 DANN gibts ZWEItausenDREIzehn ein paar DINge, | 

007 °hh auf DIE wir uns echt FREUN können; | | 

008 ja, | 

009 die GEZ gebührn zahlt NICHT mehr jeder 
EINzeln- | 

010 sondern NUR noch pro HAUShalt-| | 

011 UND, | 

012 °hh die PRAxisgebühr wird Ebenfalls 
ABgeschafft-|| 

013 ABsolut TOP; || 

014 Mi: was nicht GANZ so TOP is-| 

015 sind die PREISerhöhungen beim STROM- | 

016 und AUCH dass FUßballtrainer felix MAgath jetzt 
!DOCH! wieder [auf die TRAInerbank will; || 

017 M2: [((lacht)) ] 

018 M1: [ MENSCH- |] 

019 O:H; | | 

020 M2: JA- | 

021 aber ALL das werden wir überLEben- | 

022 EV: Song setzt ein 

023 M2: denn zweitausenDREIzehn wird ein !HAM!merjahr 
mit HAMmeralben; | | 

024 Lying; | 

025 LESli CLIo-| 

026 und DEpeche MODE; | 

027 DIE melden sich zu!RÜCcK!; || 

028 °h wann geNAU, | 

029 DAS hört ihr nach den NÄCHsten beiden SONGS- | 

030 Ml: CRO (-) EINmal um die WELT spieln wa euch-| 

031 und das hier sind GARbage-| 

032 BLOOD (.) for POPies-| | 

033 mach AN (.) und LAUT; || 


Transkript 5: Sender E2, Moderationsabschnitt 2 (Audio 5) 


Stimmlich fallen ähnliche Merkmale wie im ersten Moderationsabschnitt auf. Der 
Moderator bewegt sich in seiner Begrüßung im auditiven Bereich zwischen 1 und 
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4. Dennoch wirkt er nicht monoton, da sich die Tonhöhe zwischen den einzelnen 
Silben häufig ändert und nur zu Beginn auf einer Ebene bleibt. Im Vergleich zum 
Sprecher des Senders 5 sind die akustisch messbaren Tonhöhensprünge in der 
Begrüßung deutlich geringer, sie bewegen sich zwischen 78 und 200 Hz und um- 
fassen damit rund 16 Halbtöne (siehe Abbildung 8). 
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Abb. 8: Sender E2 — Melodieverlauf des Sprechers in der Begrüßung „Und damit ist es 


vier nach acht, schönen guten Morgen, hier sind *Name Moderatorin* und *Name 
Moderator*“ 


Die Moderatorin begrüßt die Zuhörenden anschließend ebenfalls und beginnt, 
„Dinge, auf die wir uns [im Jahr 2013, RF] echt freuen können“, zu nennen. In 
ihrer Begrüßung wirkt sie etwas melodiöser als ihr Moderationspartner. Auditiv 
werden Werte zwischen 2 und 6 vergeben, akustisch liegen die Frequenzen zwi- 
schen 157 und 338 Hz, was einen Stimmumfang von etwa 13 Halbtönen ergibt 
(siehe Abbildung 9). Damit ist der Stimmumfang der Sprecherin akustisch gerin- 
ger als der des Sprechers, anders als auditiv wahrgenommen. Im weiteren Verlauf 
variiert die Moderatorin ihre Grundfrequenz stärker. Hier liegen die auditiven 
Werte zwischen 2 und 7 und die akustisch messbaren Frequenzen zwischen 128 
und 428 Hz, was etwa 21 Halbtöne umfasst. 
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Abb. 9: Sender E2 — Melodieverlauf der Sprecherin im ersten Teil der Begrüßung „Schönen 
guten Morgen und wenn wir den heutigen Tag überleben sollten, dann gibt's 


zweitausenddreizehn ein paar Dinge“ 
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Am Ende des Moderationsturns wird die Sprecherin monotoner und liegt auditiv 
zwischen 2 und 4 (155 bis 298 Hz, 11 Halbtöne). Der Turn endet mit fallendem 
Melodieverlauf und wirkt deshalb natürlicher als die häufigen interrogativen 
Muster im Sender 5. Der Moderator erwähnt mit den „Preiserhöhungen beim 
Strom“ und der Tatsache, dass „Fußballtrainer Felix Magath jetzt doch wieder auf 
die Trainerbank will“, zwei negative Prognosen für das kommende Jahr. Letzteres 
wird mit einem genervt-klingenden „Mensch“ und lautem Ausatmen als beson- 
ders unliebsames Ereignis dargestellt. An dieser Stelle kichert die Moderatorin 
laut und hoch. Auffällig ist, dass das klischeehaft „männliche“ Thema Fußball 
vom Moderator erwähnt wird und die Moderatorin keine inhaltliche Ergänzung 
bringt. Hier werden demzufolge Geschlechterrollenbilder bedient, jedoch ge- 
schieht dies im Gegensatz zu Sender 5 weniger explizit, denn „das Geschlecht der 
Moderierenden tritt hierbei insgesamt in den Hintergrund und wird nicht weiter 
„brought about‘ aktualisiert“ (Galonski / Finke in diesem Band). Der Melodiever- 
lauf des Moderators erscheint sehr monoton. Es werden auditiv Werte von 1 bis 
4 vergeben. Messbar ist in diesem Abschnitt ein Stimmumfang von 65 bis 164 
Hz. Da dies sogar 16 Halbtönen entspricht, liegen auditive Wahrnehmung und 
messbare Werte relativ weit auseinander (siehe Abbildung 10). 
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Abb. 10: Sender E2 — Monoton wirkender Melodieverlauf des Sprechers bei 
„Preiserhöhungen im Strom“ und „Fußballtrainer Felix Magath“ 


Frequency (Hz) 


Moderationsabschnitt 3: Der dritte Moderationsabschnitt beinhaltet (ähnlich 
wie der zweite) die Erwähnung der „ersten musikalischen Highlights fürs neue 
Jahr“. Es wird deshalb dazu geraten, Geschenke lieber nach Weihnachten und so- 
mit im kommenden Jahr zu verteilen. 


001 M2: mit UNS-| 

002 kommt IHR GUT aus den FEdern am FREItag MORgen noch 
zum le das LETZte mal zur Arbeit gehn; | 

003 dann IS für die MEISten WOCHenende; | 

004 ZEHN nach ACHT ham wars hier is ((Name Sender E2))| 

005 am MORgen. | | 

006 Ml: zu WEIHnachten, | 
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007 geSCHENke machn das kann ja irgendwie JEder JA, | 


008 DESwegen SCHENKT doch einfach ma NACH WEIHnachtn, | 

009 im neuen JAHR-| 

010 zu FASCHing OStern VÖLlig LATte, | 

011 denn ((Name)) hat die ersten MUsikalischen HIGHlights 
fürs neue JAHR. || 

012 EV: Beitrag wird eingespielt 


Transkript 6: Sender E2, Moderationsabschnitt 3 (Audio 6) 


Zunächst findet eine Begrüßung durch den Moderator statt, die zu Beginn recht 
monoton wirkt. Melodiöser wirkt der zweite Teil der Begrüßung, in dem der 
Name des Senders genannt wird. Akustisch messbar liegen die Frequenzen des 
ersten Begrüßungsteils bei 54 bis 228 Hz und umfassen damit 25 Halbtöne, im 
zweiten Teil sind Frequenzen von 69 bis 189 Hz messbar, was 17 Halbtönen ent- 
spricht. Der Vorschlag, Geschenke lieber nach Weihnachten zu verteilen, und die 
Überleitung zu einem Beitrag neuer „musikalischer Highlights“ werden von der 
Moderatorin gebracht. Hier lassen sich akustische Werte größerer Abschnitte nur 
schwer ermitteln, da die unterlegte Musik eine genaue akustische Messung er- 
schwert. Auditiv wirkt die Sprecherin sehr melodiös und spricht in Bereichen zwi- 
schen 1 und 6, wobei sich die Werte von Silbe zu Silbe ständig verändern. Die 
Teilsätze enden mit steigendem Melodiemuster und erst im letzten Abschnitt fal- 
lend, was ebenfalls zu einer melodischen Wirkung beiträgt. 


In der Gesamtauswertung des Senders E2 umfassen die Redeanteile der Modera- 
torin 323 und die des Moderators 296 Silben. Die Moderatorin spricht in den un- 
tersuchten Abschnitten demnach etwas mehr als ihr Moderationspartner. Der re- 
lative Wert der gleichbleibenden Melodieverläufe ist bei beiden Moderierenden 
ähnlich, der Sprecher ist nur wenig monotoner als die Sprecherin. Im Vergleich 
der relativen Häufigkeiten der auditiv zugeordneten Stimmhöhen zeigen sich grö- 
Bere Unterschiede. Für den Sprecher werden deutlich häufiger die Werte 1 und 2 
vergeben als für die Sprecherin. Dahingegen treten die Werte 6 und 7 nur bei der 
Moderatorin auf (siehe Tabelle 3). Der Sprecher wirkt deshalb tiefer und weniger 
melodiös als die Sprecherin. 


Silben- Wert 1 Wert 2 Wert 6 Wert7 | Melodie | Melodie 
anzahl = 1 
(gesamt) 
323 9 40 13 3 181 142 
Frau (100%) (2,79%) | (12,38%) | (4,02%) | (0,93%) | (56,04%) | (43,96%) 
296 28 101 0 0 160 109 
Mann (100%) | (10,41%) | (37,55%) | (0,00%) | (0,00%) | (59,48%) | (40,52%) 


Tab. 3: Auditive Bewertung der Moderierenden im Sender E2 — Tonhöhe und Melodie 
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Im Vergleich der akustisch gemessenen Frequenzen zeigen sich ebenfalls Unter- 
schiede zwischen beiden Personen. Die Grundfrequenz der Moderatorin beträgt 
im Mittel 200,25 Hz, die Grundfrequenz des Moderators 127,38 Hz. Beide liegen 
damit im physiologischen Hauptsprechtonbereich für Gespräche nach Herbst 
(1964, 152). Der Mittelwert der minimalen Grundfrequenzen der Moderatorin er- 
scheint mit 78,17 Hz sehr niedrig, der Wert für den Moderator beträgt ebenfalls 
niedrige 66,7 Hz. Im Mittel erreicht die Moderatorin eine maximale Grundfre- 
quenz von 335,47 Hz, der Moderator lediglich 208,46 Hz. Gemessen in Halbtönen 
ergibt das einen Umfang von 25,22 für die Sprecherin, der Sprecher liegt mit ei- 
nem Umfang von 19,72 Halbtönen deutlich darunter (siehe Tabelle 4). 


F0 © F0 FOmin OFOmin FOmax OFOmax Stimmumfang 

[Hz] | [Hz] [Hz] [Hz] [Hz] [Hz] [Halbtöne] 
Frau | 200,25 | 30,14 | 78,17 | 37,78 | 33547 | 55,66 25,22 
Mann| 127,38 | 12,24 | 66,70 | 14,80 | 208,46 | 20,62 19,72 


Tab. 4: Akustische Analyse der Moderierenden im Sender E2 — Frequenz und 
Halbtonumfänge 


4 Diskussion und Fazit 


Die Untersuchung hat gezeigt, dass Tonhöhenumfang und Sprechmelodie nicht 
pauschal an das Geschlecht des Moderierenden geknüpft sind. Im Sender 5 hat 
der Moderator mit 27 Halbtönen einen größeren Stimmumfang als die Moderato- 
rin mit 19 Halbtönen. Auditiv sprechen beide Personen sehr melodiös. Bei etwa 
52,8% der Gesamtanzahl gesprochener Silben pro Moderationsausschnitt kom- 
men Tonhöhenveränderungen in Folgesilben häufiger beim Moderator vor als bei 
der Moderatorin, die ihre Tonhöhe in durchschnittlich 47,2% der Fälle variiert. 
Der Moderator nutzt deutlich häufiger den tiefen Tonhöhenbereich als die Mode- 
ratorin, die hohen Werte 6 und 7 werden von beiden Moderierenden mit 12,96% 
(Frau) bzw. 10,63% (Mann) ähnlich oft verwendet. Das erklärt den größeren 
Stimmumfang des Moderators. Im Sender E2 liegt der messbare Stimmumfang 
der Moderatorin mit 25 Halbtönen über dem des Moderators mit 20 Halbtönen. 
Die Tonhöhenvariation in den Folgesilben ist bei der Moderatorin etwas höher als 
beim Moderator; bezogen auf die Gesamtanzahl der gesprochenen Silben pro Mo- 
derationsausschnitt beträgt sie 44,0% im Vergleich zu 40,5%. Auditiv nutzt auch 
dieser Moderator wesentlich häufiger seinen tiefen Tonhöhenbereich als die Mo- 
deratorin. Sehr hohe Tonlagen kommen bei ihm gar nicht vor, auch die Modera- 
torin verwendet sie eher selten. 
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Demzufolge müssen die Hypothesen 1 und 2 verneint werden: In den unter- 
suchten Morningshows verwenden die Radiomoderatorinnen nicht zwangsläufig 
einen größeren Stimmumfang und eine variationsreichere Sprechmelodie als die 
Radiomoderatoren, das trifft in diesem Fall nur auf Sender E2 zu. Der kleinere 
Halbtonumfang und die geringfügigeren Melodiesprünge des Moderators im Sen- 
der E2 sind aber vermutlich eher ein Zeichen der vordergründigen und ernsteren 
Musikexpertise als ein Zeichen der „männlichen“ Sprechweise des Moderators, 
da sie unabhängig von Genderkonstruktionen auftreten. 

Nach Galonski (2017) kommen genderisierte Klischees im Sender 5 häufiger 
vor als im Sender E2, was sich in der vorliegenden Untersuchung ebenfalls bestä- 
tigt hat. Der Stimmumfang beider Moderierenden unterscheidet sich im Sender 5 
um acht Halbtöne, im Sender E2 um fünf Halbtöne. Dies könnte man zunächst als 
Bestätigung von These 3 auffassen: Im Sender 5, der oft auf Genderklischees re- 
feriert, ist der Unterschied zwischen Radiomoderatorin und Radiomoderator grö- 
Ber als im Sender E2, der Genderklischees kaum aufgreift. Allerdings sind die 
ermittelten Differenzen nicht besonders groß. Zudem ist es gerade Sender 5, bei 
dem der Moderator melodiöser und mit größerem Stimmumfang spricht als die 
Moderatorin, was den in der Einleitung vorgestellten Genderklischees wider- 
spricht. Weiterhin kann eine konkrete genderspezifische Benutzung von Melodie- 
mustern für die Untermauerung von Stereotypen in den analysierten Moderations- 
abschnitten nur selten gefunden werden. Lediglich an einer Stelle des Senders 5 
tritt ein direkter Zusammenhang zwischen genderisierten Klischees und Stimm- 
umfang sowie Sprechmelodie auf. Hier klingt die Moderatorin bei der Aufzählung 
„weiblicher“ Klischees höher und melodiöser als der Moderator, der bei der Nen- 
nung der „männlichen“ Stereotype tiefer und monotoner spricht als zuvor. Inso- 
fern kann auch These 3 nicht hinreichend bestätigt werden. 

Insgesamt lässt sich vermuten, dass die Verwendung von Stimmumfang und 
Sprechmelodie eher sender- als genderspezifisch ist. Sie werden nicht als Marker 
für typisch „weibliches“ und „männliches“ Sprechverhalten benutzt, sondern 
scheinen eher ein typisches Sprechverhalten im Radio aufzuzeigen. Die in den 
Moderationssequenzen berechneten Halbtonumfänge weichen stark von ge- 
sprächsüblichen Stimmumfängen ab (Herbst 1964; P&piot 2014) und sind Halb- 
tonumfängen in Radio-Nachrichten näher (Grawunder et al. 2006). Dies zeigt, 
dass in den konstruierten Gesprächssituationen der Radio-Morningshows be- 
stimmte Melodiemuster üblich sind, an die sich die Moderierenden (bewusst oder 
unbewusst) halten. Besonders stark tritt dies im öffentlich-rechtlichen Sender 5 
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hervor. Diese Ergebnisse, die in einer Pilotstudie anhand von zwei Sendern ge- 
wonnen worden sind, zeigen Tendenzen auf, die zu weiteren Untersuchungen an- 
regen. 
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„Haudi Gaudi und bleibt Soulful“ 
HipHop-Radio als Educated Radio und Nischenangebot 
in der deutschen Rundfunklandschaft 


Thomas Wilke, Ludwigsburg 


„I guess, this is my dissertation | Homie this shit is basic, welcome to Graduation.” 
Kanye West Good Morning, 2007 


Der folgende Beitrag widmet sich mit dem 2018 gestarteten Hamburger Radio- 
sender Say Say — Soulful HipHop Radio einem recht jungen Radioangebot, das 
zugleich über eine charakteristische Musikfarbe zwar jugend- und popkulturell 
eine breite Hörerschaft anspricht, als Radioprogramm aber als Nische verstanden 
werden muss. Es geht im Folgenden um eine Einordnung innerhalb der Radio- 
landschaft im Allgemeinen und im Besonderen sowie um eine explorative Annä- 
herung an das Programm und sein Flaggschiff, die Morningshow. Dabei geht es 
im Wesentlichen um eine analytische Perspektive, die ein Nischenformat in den 
Blick nimmt und zu ergründen versucht, warum ganz spezifische Medienangebote 
auch als ganz spezifische, informelle Bildungsangebote verstehbar sind. 


1 Einleitung 


Radiohören gehört nach wie vor in Deutschland zu den beliebtesten alltäglichen 
Medienpraxen. Die regelmäßig stattfindenden Untersuchungen der MedienAna- 
lysen und der MediaPerspektiven belegen in den letzten Jahren eine ungefähr 
gleichbleibende Nutzungsdauer und ebenso gleichbleibende Hörerverteilung über 
den Tag, was als eine starke Nutzungsgewohnheit eingeschätzt werden kann. 
Schaut man sich aktuelle Betrachtungen, Untersuchungen und Analysen zum Ra- 
diogeschehen in Deutschland an, so fällt allerdings auf, dass die Betrachtungen 
entweder auf die Rezeptionsweisen und das Nutzungsverhalten abzielen, rund- 
funkhistorische Foki verfolgen oder spezifische ästhetische Merkmale wie Ver- 
packungen oder Moderationen in den Vordergrund rücken. Sehr viel auffälliger 
ist, dass bestimmte Programmformate oder Programmstrukturen gar nicht mehr 
in den Blick wissenschaftlicher Untersuchungen geraten. 

2020 verzeichnet Deutschland ein Radioangebot von insgesamt 74 öffentlich- 
rechtlichen Sendern und 274 privaten Sendern, hinzu kommen noch 113 sonstige 
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Sender, zu denen überwiegend nichtkommerzielle Lokalradios, Hochschulradios 
und freie Radios zählen. Die Tendenz der letzten 15 Jahre ist dabei stetig steigend 
— zum Vergleich: 2005 waren es 59 öffentlich-rechtliche, 202 private und 65 an- 
dere Sender. Ausgenommen sind hierbei reine Online-Radios bzw. Radios, die ihr 
Angebot ausschließlich über das Internet distribuieren. Deren Anzahl ist alles an- 
dere als gering, umfasst alle vorstellbaren Sparten und reicht im Spektrum von 
Hobby bis Profi. Die Medienanstalten (ALM 2020, 17) sprechen bei einer Netto- 
Digitalisierungsquote von 63 Prozent mittlerweile von „digitaler Hörfunkübertra- 
gung“, was nicht nur die Übertragungswege meint, sondern die Ausstattung im 
Haushalt miteinbezieht. Unabhängig von konvergenten Endgeräten nutzen knapp 
45 Prozent der Personen ab 14 Jahren in Deutschland Webradio. Das bedeutet im 
Weiteren, dass sich eine Verschiebung abzeichnet, der es nachzugehen gilt. 

Der folgende Beitrag widmet sich mit dem 2018 gestarteten Hamburger Radi- 
osender Say Say — Soulful HipHop Radio einem recht jungen Radioangebot, das 
zugleich über eine charakteristische Musikfarbe zwar jugend- und popkulturell 
eine breite Hörerschaft anspricht, als Radioprogramm aber als Nische verstanden 
werden muss. Es geht im Folgenden um eine Einordnung innerhalb der Radio- 
landschaft im Allgemeinen und im Besonderen sowie um eine explorative Annä- 
herung an das Programm und sein Flaggschiff, die Morningshow. Explorativ des- 
halb, weil die Forschungslage hierzu nach wie vor als defizitär zu bezeichnen ist 
und sich die vielfältigen Produktions- und Distributionsformen von radiophonen, 
auditiven Formaten als Gesamtpaket einer Kategorisierung, wie sie bislang im 
linearen Radio beobachtbar war, entziehen. Dabei geht es im Wesentlichen auch 
um eine analytische Perspektive, die ein Nischenformat in den Blick nimmt und 
zu ergründen versucht, warum ganz spezifische Medienangebote auch als ganz 
spezifische Bildungsangebote verstehbar sind. In einer solchen Perspektivierung 
können sie auch nicht losgelöst von ihrer Ästhetik, im Sinne einer ästhetischen 
Erfahrung, betrachtet werden. Radiohören als Bildungsprozess impliziert zudem 
eine andere Form des Zuhörens, nämlich Antizipation und Hörerwartung. Infor- 
melle Bildungsprozesse beim Radiohören setzen so neben Aspekten der Vermitt- 
lung, der Ressourcen, des Vorwissens und Motivationen auf schwer quantifizier- 
und messbare Faktoren wie Vertrauen, Authentizität, Respekt und Autorität. 
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2 Radio - Webradio - Digital Audio — Programmformate und 
HipHop im Radio 


Walter Klingler (2017, 135) konstatiert für 2017 auf der Grundlage des Webradi- 
omonitors 2016 ca. 10.000 Webradio- und Onlineangebote und es ist anzuneh- 
men, dass es zwar eine Fluktuation gibt, die Zahl aber bis heute insgesamt eher 
weiter gestiegen ist. In der Grundunterscheidung terrestrisch verfügbarer Radi- 
oprogramme existieren drei unterschiedliche Typen bzw. Formate: Begleitpro- 
gramme, Einschaltprogramme und Nachrichten- bzw. Infoprogramme (vgl. ebd. 
136 f.). Begleitprogramme charakterisieren sich durch ihre hohe Durchhörbarkeit 
und das Versprechen einer „akustischen Heimat“, die bestimmte Kernelemente 
aufweist: die spezifische Musikfarbe und spezifische Informations- und Wortan- 
teile, „Art und Inhalte der Informationen und schließlich die Form und der Stil 
der Präsentation, der Ansprache, generell auch das ‚On-Air-Design‘, das zur To- 
nalität eines Programms beiträgt“ (ebd.). Einschaltprogramme als öffentlich- 
rechtliche Domäne zeichnen sich durch einen diskursiven Charakter aus, indem 
sie einen hohen Wortanteil bzw. längere Wortstrecken anbieten. Neben Nachrich- 
ten werden in verschiedenen Gesprächs- und Magazinformaten gesellschaftliche 
Themen redaktionell betreut, im Weiteren auch Musikangebote, die allerdings 
eher weniger den Popmusikbereich ansprechen. 


Die Verbindung von HipHop und Radio ist frühzeitig angelegt, nicht nur in der 
Anfangszeit in den USA, sondern auch in Deutschland, wenn auch mit der ent- 
sprechenden zeitlichen Verzögerung und den institutionellen Einschränkungen. 
Gerade lokale Radiostationen spielen in der USA bei der Verbreitung von Rapmu- 
sik eine elementare Rolle. David Toop (1992, 57 f.) beschrieb nicht nur frühe 
Formen und Vorgänger des Rappens als Sprechstil von Radio-DJs, sondern auch, 
dass Rap im HipHop-Stil 1979 durch Mr. Magic’s Rap Attack auf WHBI, einer 
kleinen Radiostation in New Jersey, ausgestrahlt wurde. Die Show wechselte spä- 
ter zu Frankie Crockers WLBS, der Flaggschiff-Station des Mutual Black Net- 
work, und wurde zur meistgehörten HipHop-Sendung Amerikas. In diesem Zu- 
sammenhang spielen Radio-DJs eine zentrale Rolle (vgl. Passman 1971; Schopp 
2014; Nieswandt 2017). In Deutschland sind die Quellenlage und Forschung 
hierzu mehr als spärlich, von einer systematischen Aufarbeitung kann bislang 
keine Rede sein. 


Eine der wenigen Sendungen im deutschen Radio mit dem Label ‚Black Musik‘ 
hieß Soultrain wie die gleichnamige amerikanische Musiksendung und lief mon- 
tags, moderiert von Ruth Rockenschaub und Peter Urban, beim Norddeutschen 
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Rundfunk (NDR). Der spätere HipHop-DJ und Musikproduzent Marius No. 1 be- 
gann 1988 über den Kontakt zu Ruth Rockenschaub beim NDR eine monatliche 
Radiosendung. Auf Veranlassung von Redakteur Klaus Wellershaus folgte später 
eine Rap-Radiosendung, die er bis 1992 gemacht hat: „Die erste Sendung hieß 
‚Kopfhörer‘, und ich habe meine Sendung dann in ‚Number One Mixshow‘ um- 
getauft, weil ‚Kopfhörer‘ ziemlich uncool klang.“ (Marius No. 1, zit. nach Kre- 
kow / Steiner 1999, 20). Insbesondere freie Radios und nichtkommerzielle Lokal- 
radios boten und bieten HipHop und Rap über verschiedene Sendeformate im 
deutschen Raum eine Plattform, die zumeist nicht nur als Unterhaltungsangebot 
wahrgenommen wird, sondern lokal eine organisatorisch-integrative Funktion 
übernimmt. Aktuelle Szeneentwicklungen artikulieren sich da, DJs und Rap- 
per*innen werden eingeladen und geben so mit hohem Eigenengagement Orien- 
tierung und Kontinuität. Mit Blick auf Radiostationen ist die Situation in Deutsch- 
land vergleichsweise sehr überschaubar. Der Stuttgarter Sender BigFM sowie die 
beiden Berliner Sender Jam FM und KISS FM setzen überregional in ihrem line- 
aren Programm auf HipHop-Musik, wobei sich hier eine Melange ergibt zwischen 
deutschem und amerikanischem Rap, Mainstream-Titeln, R'n'B und Urban, einer 
eher weichen Sammelkategorie für Black Musik. Alle Sender sind entweder über 
ihre Webseite oder über Plattformen wie Radioplayer individuell abrufbar und 
bieten verschiedene Streams an. Bei KISS FM kann man beispielsweise neben 
dem Live-Stream zwischen Urban Beats, Old School-HipHop, R'n'B, Deutschrap 
Brandneu, Deutschrap Hits und vielen weiteren Streams wählen. Andere Sender 
führen HipHop lediglich als eine Musikfarbe neben Rock und Pop und anderen 
oder bieten über ihre digitalen Distributionswege eigene Kanäle an, so dass sich 
hier eine Vielzahl an individualisierten Nutzungsmöglichkeiten ergibt. 


Schaut man nun aufreine Webradios, also Radioangebote, die ausschließlich im 
Internet stattfinden und mehr als reine Playlisten sind, da es einen redaktionellen 
Hintergrund gibt, eröffnet sich eine durchaus größere Bandbreite. Reine HipHop- 
Kanäle größerer Radiostationen werden hier nicht mit aufgeführt, es können nur 
einige stellvertretend genannt und kurz charakterisiert werden, die konzeptionell 
und redaktionell ein eigenes, differenziertes und professionelles Profil aufweisen. 
Soweit nicht anders angegeben, sind die Zitate der den Webseiten der Sender ent- 
nommen. 

So sendet bereits seit 2003 BMRadio aus Hamburg mit dem Claim „24/7 Finest 
in Black Music“. Zu dem Livestream und den in der Woche platzierten unter- 
schiedlichen Shows gibt es auch eine dazugehörige Seite, die mit Videos als TV- 
Angebot konfiguriert ist. Auf dieser Seite finden sich nicht nur Videos zu unter- 
schiedlichen musikalischen Kategorien, sondern auch dokumentarisches Material 
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und Sendungsmitschnitte einzelner Moderatoren wie beispielsweise MCHums. 
DefJay aus Berlin sendet seit 2005 und wirbt mit dem Claim „The Place to be in 
RnB“. 

Ein weiteres relativ junges Webradio aus Berlin ist PELI ONE, das seit Mai 
2017 sendet, momentan verstärkt über das Internet, eine DAB+-Lösung für Ham- 
burg, Berlin und Brandenburg wird angegeben. PELI ONE, das schrittweise zum 
Vollprogramm ausgebaut werden soll, bezeichnet sich auf der Webseite als „das 
erste Radioprogramm im Format Urban Adult Contemporary (Urban AC)“ mit 
einem „Programm für erwachsene Black Music Fans (Zielgruppe: 30-50), die 
sich bei anderen Sendern weder musikalisch noch durch die Ansprechhaltung zu 
Hause fühlen“. Der Sender beschreibt sich als Urban Music Radio folgenderma- 
Ben: 


„Wir wollen PELI ONE zu dem Sender machen, mit dem Du morgens in den Tag 
startest. Deshalb bieten wir Dir neben aktuellen News zu Künstlern, Background- 
Infos, Musik-Reviews, Interviews und Veranstaltungshinweisen einen abwechs- 
lungsreichen Mix aus Verbraucher- und Servicethemen von Wellness, Wohnen, Ur- 
laub, Beauty, Erholung und Entspannung, Fitness und Gesundheit bis zu Technik, 
Mobilität und Entertainment. Integrieren statt polarisieren: Als Medienmacher wol- 
len wir einen konstruktiven gesellschaftlichen Beitrag leisten und den Zusammen- 
halt fördern. Deshalb machen wir Bildung und Integration zu Schwerpunktthemen. 
PELI ONE ist digitales Radio. Du kannst uns überall online hören.“ (PELI ONE) 


Zudem steht „Musikkompetenz“ als zentraler Begriff im Vordergrund, denn man 
möchte „Hintergrund vermitteln, Orientierung geben“ (ebd.). Allerdings verbleibt 
der Anspruch in seiner Umsetzung nur schwer greifbar. Ein zwölfköpfiges Team 
steht hinter dem umfangreichen Sendeplan, der neben einer täglichen Morning- 
show von sechs bis zehn Uhr einen kuratierten Musiktag bis 18 Uhr aufweist. 
PELI ONE ist zudem auch noch mit einem weiteren Radiosendeformat namens 
Rap2Soul verknüpft. 

Shake!FM startete ebenfalls 2017 in der Eigenaussage als „Hobbyprojekt“, in- 
dem Michel Mertens einen „öffentlich angebotene[n] nichtkommerzielle[n] Mu- 
sikblog mit passendem musikalischem Musikstream zu eurem täglichen Dreh- 
buch, voller Leidenschaft und Unabhängigkeit“ gründete. Seit Januar 2020 ist 
Shake!FM gewerblich und offeriert mit einem Abo-Modell eine direkte Unter- 
stützung von 65 Prozent der Einnahmen an die Künstler*innen, die im Programm 
gespielt werden. Zusätzlich sind alle Shows auf Mixcloud hochgeladen und über 
das Abo-Modell verfügbar. 
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Hinsichtlich der technischen Vernetzung ist bemerkenswert, dass fast alle re- 
cherchierten Webradios auf den Webseiten neben den Aggregatoren wie radio.de 
und anderen mittlerweile auch auf Smartspeaker-Lösungen verweisen und hier 
dezidierte Sprechanweisungen für den Empfang über beispielsweise Alexa geben. 


3 Say Say - Soulful HipHop Radio aus Hamburg 


Neben den genannten gibt es eine Vielzahl anderer Webradios, die in der Musik- 
farbe beispielsweise eine Mischung aus französischem, deutschem und amerika- 
nischem Rap herstellen, wie das Nürnberger Webradio N90 4..Beat. Der Fokus 
soll hier aber auf einem Hamburger HipHop-Webradio liegen: Say Say — Soulful 
HipHop Radio. Dieses ist ein Radioangebot, das man in der gegenwärtigen deut- 
schen Radiolandschaft als einzigartig betrachten kann. Im Gegensatz zu den an- 
deren bereits genannten Stationen ist hier aber der Zugang ein anderer. Frederick 
Staudacher, der sich selbst durchgehend im Radio und auf der Webseite kurz Fre- 
ddy nennt, ist promovierter Jurist, gab jedoch seinen Job als Anwalt auf und ging 
mit Say Say als einem rücklagenfinanzierten Projekt am 25. April 2018 auf Sen- 
dung. Die immer wieder zum Ausdruck kommende enge Verbindung zum ameri- 
kanischen HipHop und der sehr starken Prägung in den 1990er Jahren, der soge- 
nannten Goldenen Ära des HipHop, riefen bei ihm in der deutschen Radio- 
landschaft einen ‚Missing Link‘ hervor: 


„Dieses ständige Wiederholen der gleichen Hits, ständig Gewinnspiele, ähm, dann 
die Moderatoren, die sehr entkoppelt von der Musik sind, wo es gar nicht mehr um 
die Musik geht, wenn die moderieren, weil die die Musik gar nicht mehr selbst 


aussuchen. Da fehlte mir einfach vieles.“ (Staudacher, zit. n. Satl regional). 


Deutlich wird hier die Identifikation zwischen Sender, Sendeinhalt und Ak- 
teur*innen. Say Say sendet als Streaming über die Website oder als App über ver- 
schiedene Aggregatoren wie beispielsweise Radio Player. Say Say hat, analog zu 
anderen Radiostationen, einen Sendeplan, der zudem die etablierten Hörgewohn- 
heiten berücksichtigt. Das heißt, es gibt von Montag bis Freitag eine moderierte 
Morningshow, über den Tag verteilt eine etwas ruhigere Musikauswahl, die ein 
Durchhören möglich macht und nur von vorproduzierten Beiträgen und Jingles 
unterbrochen wird, und am Abend Spezialsendungen (siehe Abbildung 1). 


Im Tagesprogramm wird hauptsächlich englischsprachiger HipHop gespielt mit 
einer Mischung zwischen der Old School der achtziger Jahre, der New School der 
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neunziger Jahre bis zur Gegenwart und Neuentdeckungen. Hinzu kommt Musik 
aus den Bereichen Funk und Soul und auch hier erstreckt sich die Spannbreite von 
den 70er Jahren bis in die Gegenwart. Getreu dem Motto, was groovt, passt ins 
Programm. Betrieben wird das Ganze privatwirtschaftlich von Frederick Stauda- 
cher, der nach Eigenaussage mit einem kleinen Team und viel Engagement einen 
Radiosender auf die Beine gestellt hat. Dieser entspricht in seiner Umsetzung viel- 
leicht nicht nur seinen Vorstellungen von Radio, sondern hat amerikanische Ra- 
diostationen gerade der Ostküste als Vorbild. 


Dienstag 


DIE MORNINGSHOW 


BEATS & 
ab 7 Uhr live moderiert aus Hamburg von 


BREAKFAST 


Freddy und 12 Finger Dan mit L-Tonic® 


16 - 20 Uhr 
18 - 20 Uhr TGI FRIDAY 
AFTER SHOW 
WORK mit den 
SHOW Soulbrotha 
mit Sören 


18 - 20 Uhr 
LOVE TKO 
mit 
12 Finger Dan 


20-22 Uhr 
DEUTSCHRAP 
S LIEBLING mit Niko, Dan 
mit DJ Reaf und Base 


mit Nick (US) 


Abb.1: Wochenprogramm Say Say, Webseiten-Screenshot 
Der Bezugspunkt wird ebenfalls im Auftritt deutlich, denn Say Say verwendet ein 


Bild, das innerhalb der HipHop-Community zu einem der ikonischen Bilder ge- 
hört (siehe Abbildung 2): 
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Abb. 2: Screenshot der Webseite von Say Say, Landingpage 


Das Foto der Startseite der Say-Say-Webseite zeigt The Almighty KG, von den 
Cold Crush Brothers während eines Auftritts in Harlem Worlds und stammt von 
Joe Conzo Jr.. Bekannt geworden ist es spätestens seit Johan Kugelbergs Born in 
the Bronx von 2007, die Jahresangaben für das Foto bleiben unkonkret und 
schwanken zwischen 1981 und 1982. Es steht für den direkten Kontakt zwischen 
Rapper und Publikum, für das Wechselverhältnis, für Zugewandtheit, für Nähe. 
Die Cold Crush Brothers, gegründet 1978, nehmen in der Frühzeit des HipHop 
und darüber hinaus eine gewichtige Rolle ein. Dies nicht nur, weil sie mit Sha- 
Rock den ersten weiblichen MC auf die Bühne brachten, sondern weil 1979 Big 
Bank Hank für Rappers Delight Reime des Cold-Crush-Brothers-Mitglied Grand- 
master Caz ohne dessen Erlaubnis benutzte und diese schließlich prominent in 
dem ersten HipHop-Film WildStyle (1982, Regie: Ch. Ahearn) vertreten waren. 


Say Say ist auf nahezu allen Geräten verfügbar, nicht nur über die Website mit 
angezeigter Player-Leiste, einer noch in Entwicklung befindlichen eigenen App, 
einem eigenen Alexa Skill, eigener Action on Google Assistant; sondern auch mit 
einer für den Sender kostenpflichtigen Mitgliedschaft im Radioplayer und damit 
hörbar auf Sonos, Bose, Logitech, Apple TV, Fire TV und Apple CarPlay. Dem- 
entsprechend ist Say Say als state ofthe art auch auf Facebook, Instagram, Twitter, 
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Youtube und Soundcloud vertreten. Überall finden sich verschiedene Inhalte, auf 
Soundcloud beispielsweise Interviews, auf Youtube einige Clips von 12 Finger 
Dan zum Samplepingpong, auf Twitter viele themenbezogene Retweets. Es zeigt 
sich aber die Schwierigkeit, alle Kanäle in der medialen Eigenlogik aktuell und 
substantiell zu ‚bespielen‘. Sprich, mediale Aufmerksamkeit wird nur durch im- 
mer neuen Content erzeugt, der allerdings erst einmal und dann kontinuierlich 
produziert werden muss. Das benötigt Ressourcen. Auf der Webseite gibt es einen 
Newsbereich, der ausgesucht und teilweise anlassbezogen, beispielsweise bei 
neuen Albumveröffentlichungen und Jubiläen, Beiträge versammelt, die über ei- 
nen längeren Zeitraum abrufbar sind. Zugleich gibt es einen engen Zusammen- 
hang zwischen auf der Webseite veröffentlichten Beiträgen und dem Radiopro- 
gramm, so wurde beispielsweise das 25-jährige Jubiläum der gleichzeitigen 
Veröffentlichung von 2Pac All eyez on me und der Fugees The Score entsprechend 
in die Morningshow integriert und ausführlich auf der Website vorgestellt. Dar- 
über hinaus gibt es kurze Interviews mit weiteren Protagonist*innen des Senders. 

Um den Sender hörbar identifizieren zu können, gibt es auch Verpackungsma- 
terial in Form von Jingles. Einen nutzt Say Say als Vokalsample aus Lauryn Hills 
Part aus dem Song Oh La La La von 1996, ein anderer — Hoch die Hände, Wo- 
chenende — wurde von Frederick Staudachers Kindern eingesprochen. 


4 Zur Finanzierung und Werbung von Say Say 


Der Macher von Say Say, Frederick Staudacher, weiß in Zeiten von Gratis- 
Streams, Playlisten und viraler Dauerbeschallung um die Schwierigkeit, ein qua- 
litativ anspruchsvolles Programm zu finanzieren. Deshalb gibt es mittlerweile für 
die Hörer*innen ein transparentes Modell für die Frage nach der Finanzierbarkeit. 
Staudacher erklärt dies selbst in einem kurzen Video auf der Webseite, um deut- 
lich zu machen, dass der Idealismus nicht an die eigenen endlichen Ersparnisse 
geknüpft sein muss, wenn sich die Hörer*innen an den Kosten beteiligen. Dafür 
gibt es die sehr überzeugende Aufrechnung in Form von drei Säulen, von denen 
eine die Hörerschaft darstellt. Um hier transparent argumentieren zu können, wird 
der Hörerschaft aufgezeigt, welche Kosten abzudecken sind. Zudem werden vor- 
produzierte Spendenaufrufe als redaktioneller Beitrag ins Programm integriert. 


Das Pfandgeld einer Plastikflasche am Tag und in der Hochrechnung dann 7,50 
Euro im Monat würden als Spende einen ausreichenden Betrag darstellen. Dane- 
ben gibt es einen Merchandising-Shop, der Say Say nicht nur einen finanziellen 
Ertrag bringt, sondern den Radiosender darüber hinaus als Marke noch stärker 
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verankert. Die Angebote des Shops selbst werden als nachhaltige Angebote offe- 
riert, hier eine offenkundig verantwortungsvolle Haltung. Neben dem Spenden- 
aufrufund dem Shop gibt es als dritte Säule noch Sponsoring bzw. Werbung. Das 
ist insoweit erwähnenswert, als dass Say Say hier einen eher ungewohnten Weg 
geht, als das beim Radio üblich ist. So gab es bislang keine klassischen Radio- 
werbung-Fenster, die beispielsweise kurz vor den Nachrichten geschaltet wurden 
und eher ein Sammelsurium von werbewilligen Kunden darstellen. In unter- 
schiedlicher Breite und Intensität wurden bislang monatlich Werbeschwerpunkte 
gelegt. Staudacher spricht da selbst die Werbetexte und führt ausführliche Inter- 
views mit den jeweiligen Betreiber*innen beziehungsweise Geschäftsführer*in- 
nen im Programm. Die Gespräche sind nicht in eine Zeitschiene eingebunden, 
sondern interessegeleitet. Beim Ersthören der Werbetrailer stellen sich erst einmal 
Irritationen ein, denn der Moderator spricht die Werbung selbst. Das Magazin 
Business Punk berichtete im Juni 2020 über Say Say und in diesem Zusammen- 
hang über die dort gesetzten Werbeideen: 


„Dabei will Staudacher anders werben als normale Radiosender — weniger nervig. 
‚Bei uns wird man keinen Spot fürs Autohaus hören‘, so Staudacher, stattdessen 
setzt er auf Native Advertising. Heißt: Die Moderator*innen bewerben die Produkte 
selbst. Zusätzlich sollen die jeweiligen Marken auf sämtlichen digitalen Kanälen 
von Say Say stattfinden. Erste Kund*innen hatten bereits Interesse, sagt Staudacher. 
Aber dann kam Corona — viele Budgets sind eingefroren.“ (Lemke 2020, o. S.). 


Hier erfolgt eine Überlagerung klassisch getrennter Sprecherrollen, zumindest für 
das deutsche Radio, und erinnert sehr viel stärker an frühere amerikanische Ra- 
dioformate, in denen die Radio-DJs selbst die Werbung in ihrer Sendung akqui- 
rierten und präsentierten. Gleichwohl ist das Involvement hervorzuheben, denn es 
wird deutlich, dass die Werbung auf Say Say wiederum in einen engen Zusam- 
menhang mit dem eigenen Authentizitätsanspruch einhergeht und es nicht um das 
Gewinnen von Werbepartnern um jeden Preis geht, sondern nur Werbepartner 
zum Zug kommen, von denen Say Say überzeugt ist. Staudacher spricht auch ganz 
konkret davon, dass er beispielsweise den Fairtrade-Kaffe trinkt und empfiehlt 
und dass er von den beworbenen Boxen schon seit langem überzeugt ist und selbst 
welche besitzt. Es ließe sich hier auch von einer identifikatorischen Wertekonver- 
genz sprechen. 
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5 Das Programm von Say Say 


Während andere Radiomacher*innen eher aus bereits gemachten Radioerfahrun- 
gen ihre eigenen Vorstellungen entwickeln, die gleichwohl im Fahrwasser radio- 
phoner Rahmenbedingungen erfolgen, ist der Ansatz von Say Say eher von der 
immer wieder zum Ausdruck kommenden Liebe zur Musik und zur HipHop-Kul- 
tur geprägt. Daran orientiert sich erkennbar die Programmierung respektive die 
Programmatik der Musik über den Tag bzw. die Woche: 


„Vom ersten Tag an war uns wichtig, dass sich say say an dein Leben anpasst! Früh 
morgens willst du andere Musik hören als bei der Arbeit. Nach Feierabend andere 
als nachts. Unter der Woche andere als am Wochenende. Und super nice soll sie 


natürlich immer sein.“ (zit. n. Say Say). 


Dementsprechend ist die Musik nachvollziehbar programmiert bzw. wird einge- 
setzt; sie setzt erst einmal auf eine Durchhörbarkeit des Senders. Gleichwohl po- 
sitioniert sich Staudacher eindeutig im Programm hinsichtlich der Musikauswahl 
im Zusammenhang mit Rotation. Diese wird zugunsten einer größeren Musikaus- 
wahl vermieden, was auch dazu führt, dass bestimmte Songs — wie ganz promi- 
nent Hip Hop Hooray von Naughty by Nature (1993, Tommy Boy) — eher selten 
im Tages- und Wochenprogramm zu finden sind, um sie nicht „tot zu spielen“ 
beziehungsweise nicht „abzunutzen“. Songs, die in der Vergangenheit club- und 
hitparadentauglich waren, finden sich dann eher im partyorientierten Format der 
Freitagabendshow von 12 Finger Dan. Eine Wiederholung von Songs im Sinne 
einer Rotation gibt es zwar, das wird aber sehr zurückhaltend eingesetzt. 

Neben dem Flaggschiff, der moderierten Morningshow, gibt es noch sieben 
weitere Shows. Eine gibt es mit dem Schwerpunkt Soul (Love TKO, sonntags 18- 
20 Uhr mit 12 Finger Dan), eine mit US-Undergroundrap (Fadeaway Barber 
Show, dienstags 22-23 Uhr mit Nick), ebenso eine Show mit Deutschrap 
(Deutschraps Liebling, dienstags 20-22 Uhr mit DJ Reaf). Eine Kooperation mit 
dem HipHop-Magazin Backspin bringt den Podcast Love & Hate als Backspin 
FM mittwochs 20-21 Uhr. Seit dem 10. September 2020 gibt es zweiwöchentlich 
donnerstags eine Afterwork-Show mit DJ Sören Altmann: 


„Die Hörer können sich auf ‚Gute-Laune-Musik‘ mit freshen Hip-Hop-Tracks und 
der ein oder anderen R'n'B-Nummer freuen. Einfach der perfekte Soundtrack für 
Feierabendaktivitäten wie Grillen, Chillen oder Bier trinken mit Freunden.“ (Alt- 


mann, zit. n. Say Say). 
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Die Show wird in der Woche darauf wiederholt und Musikwünsche sind möglich. 
Diese sind ebenfalls bei der TGI-Freitagabendshow von Soulbrotha 12 Finger 
Dan möglich, die mit vier Stunden am Freitag als Mixshow immer wieder einen 
umfangreichen musikalischen Bogen spannt. 


6 Die Morningshow auf Say Say 


Hauptprotagonisten der Morgenshow sind der Gründer von Say Say, Frederick 
Staudacher, und DJ 12 Finger Dan. In der Grundstruktur gibt es in der Zeit von 
sieben bis zehn Uhr halbstündlich Nachrichten, teilweise mit O-Ton-Einspre- 
chern. Die Nachrichten selbst konzentrieren sich im Wesentlichen auf circa drei 
Hauptnachrichten, die das Tagesgeschehen bestimmen, sich aber im Laufe der 
Show wiederholen. Eilmeldungen, wie man sie aus dem Verkehrsfunk kennt, die 
zu einer Unterbrechung des Programms führen, gab es bislang nicht. Als sich an- 
schließendem Service gibt es das Wetter, das immer auch das Wetter in den USA 
umfasst, konzentriert auf New York und Los Angeles, stets mit der Annotation 
New York als der Geburtsstätte des HipHop. In der Lockdown-Zeit des Jahres 
2020 kam es immer wieder auch vor, dass Staudacher seine kleine Tochter mit ins 
Studio nehmen musste und sie in die Moderationen integrierte. Entweder durch 
kleine Interviews, die hier einem Rollenspiel ähnelten, oder indem sie das Wetter 
sprach. Das sind individuelle Freiheiten, die aber nicht ohne Effekt bleiben - in 
einem ganz positiven Sinne. Indem nämlich nicht ein problemloses Funktionieren 
simuliert wird, sondern die Situation kreativ gewendet und offen damit umgegan- 
gen wird. Das zeigte sich beispielsweise auch im März 2021, als durch Ferien in 
Hamburg und Homeschooling die Morningshow zu einer Morningshow Light 
wurde, die nicht durchmoderiert werden konnte. In dieser liefen dann in einem 
Abstand von circa vier Titeln aktuell vorproduzierte Beiträge, die die Sendung 
immer noch als redaktionell betreut erscheinen ließen, auch wenn die Beiträge 
wiederholt wurden. 

Für das deutsche Radio eher ungewöhnlich setzt Say Say in der Morningshow 
auf sich wiederholende, redaktionell zu verstehende Elemente, die die Wahrneh- 
mung als eine Marke verstärken. So beginnt die Show jeden Morgen programma- 
tisch mit dem gleichen Titel: Good Morning von Kanye West. Es lohnt sich hier 
kurz zu verweilen, weil der Titel selbst metaphorisch angelegt ist. Der Titel Good 
Morning ist zugleich das Intro von Wests drittem Album Graduation, das selbst 
als Weckruf an ihn selbst und die Welt gehört und verstanden werden kann. Das 
Schulthema zieht sich durch den Song und Graduation kann hier nicht nur als 
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Schulabschluss, sondern auch als Stufung, Einteilung bis zur Promotion als deut- 
lich höherem Abschluss übersetzt werden, was dann in der Übertragung auf das 
Rap Game eine weitere Bedeutungsebene erfährt. Atmosphärisch ist der Titel 
ebenso ein Weckruf, nicht zuletzt durch das chorisch eingesetzte Sample des EI- 
ton-John-Songs Someone saved my life tonight (DJM Rec., UK, 1975). 

Ebenso für das deutsche Radio ungewöhnlich ist der eher lässige Umgang mit 
einer genauen Fixierung auf sekundengenaues Timing. So kann es vorkommen, 
dass die Morningshow erst zehn Minuten später beginnt und die Hörer*innen aber 
gleich mit einer persönlichen Geschichte abgeholt werden, die weniger als Aus- 
flucht fungiert, sondern mehr die Hörer*innen-Beziehung und die Alltagsorgani- 
sation zum Thema macht. Im ersten Jahr begann die Morningshow noch 6.00 Uhr, 
das hat sich dann aber auf 7.00 Uhr verschoben. Andererseits wird dann aber die 
Freude überdeutlich thematisiert, es pünktlich sieben Uhr geschafft zu haben. Und 
so kann es dann auch mal ganz unproblematisch zehn Minuten länger gehen, weil 
Frederick Staudacher unbedingt noch einen Song vorstellen wollte, der ihm wich- 
tig war, der aber bislang im Morgenprogramm noch nicht zum Zuge kam. Oder 
es kommt zu Verspätungen bei den Nachrichten, weil der musikalische Flow die 
Programmuhr mit den anstehenden Nachrichten in den Hintergrund gedrängt hat. 
Das ließe sich pedantisch als Kritik formulieren, die allerdings ins Leere führen 
würde, denn die oben bereits so titulierte Lässigkeit steht in keinem Widerspruch 
zu der Ernsthaftigkeit des Programms. Im Gegenteil zeigt sie ganz nonchalant die 
Gewöhnung an industriell verfestigte Rhythmen auf, die so nolens volens gebro- 
chen einen Freiraum ermöglichen. Die Verlässlichkeit steht hier im Sinne der Mu- 
sik, des Flows, des Grooves und nicht einer übergeordneten Taktung, die lediglich 
die Nichtangreifbarkeit des Taktes zelebriert, unabhängig vom Moment. Ein wei- 
teres sich wiederholendes Element ist der Klassiker des Tages, mit dem die Mor- 
ningshow gegen zehn Uhr endet. 


7 Das Sample des Tages 


Das Sample des Tages ist ebenfalls eine eigene, wiederkehrende redaktionell auf- 
bereitete Rubrik, die in der Show vom Umfang nicht fest gerahmt ist und so in 
der Beitragslänge unterschiedlich ausfällt. Zwei Beispiele sollen das veranschau- 
lichen: Am 17. Februar ging es um ein revidiertes Urteil eines Gerichts in Los 
Angeles, das Robin Thicke und Pharell Williams verurteilte, an die Marvin-Gaye- 
Erben eine Strafe zu zahlen. Es ging um den seit 2015 andauernden Streit um den 
Plagiatsvorwurf, die Anmutung, den Groove von Marvin Gayes Got to give it up 
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in Blurred Lines verwendet zu haben. Staudacher liefert nicht nur eine Einord- 
nung des Streites und die Hintergründe, sondern ebenso die Vorstellung der bei- 
den Titel und macht den Versuch, den Streitgegenstand entsprechend nachzuvoll- 
ziehen. Es gelingt ihm dergestalt eine Verknüpfung von Ästhetik, historischer 
Genese, Fragen von Originalität und aktueller Rechtslage, die sich mit den Titeln 
darstellen lässt. Eine andere, gängigere Form beim Sample des Tages besteht im 
Vorstellen eines Originaltracks oder Samples, das, wenn es zu kurz ist, gern auch 
noch einmal gespielt wird, um im Anschluss zu zeigen, welche Künstler*innen 
das in der Folge verwendet haben bzw. in welchen Songs das vorkommt. Das ist 
insoweit bemerkenswert, als dass es sich dabei meistens um Songs handelt, die 
im deutschen Musikkontext — historisch und gegenwärtig — kaum eine Rolle ge- 
spielt haben. 

Am 24. Februar 2021 spielte Staudacher beim Sample des Tages als erstes Nor- 
man Connors feat. Michael Henderson You are my starship und knüpfte folgende 
Titel an: 


- 2Pac Papa ’z song (Strictly 4 My N.1.G.G.A.Z... 1993, Interscope) 

- Mobb Deep Trife Life (The Infamous, 1995, Loud Rec.) 

- Guru Insert B (The Real Deal) Nobody Knows (Guru’s Jazzmatazz 2, 1995, 
Chrysalis) 

- LL Cool J feat. Tamia Don't Be Late, Don't Come Too Soon (Phenomenon, 
1997, Def Jam) 


Zwischen den Titeln gab es eine Moderation, die den jeweiligen Künstler und 
seine Zeit und das entsprechende Lied in den Sample-Kontext einordnete. Nach 
dem letzten Track gab es über den Hinweis zur Kollaboration den Querverweis 
zu Tamia und ihrer erfolgreichen Single So into you (Tamia, 1993, Qwest), so 
dass die Vernetzung und Verquickung einzelner Songelemente, Neukonfigurati- 
onen durch Samples, Verweisstrukturen, Produktionshintergründe und kollabora- 
tive Kooperationen letztlich die Dichte musikalischen Geschehens aufzeigen. An- 
dererseits wird gerade dabei deutlich, wie schwer es ist, dies in einer zugänglichen 
Form zu artikulieren. In selbstreflexiven Momenten sind das bei Frederick Stau- 
dacher moderative Einsprengsel, wenn er beispielsweise davon spricht, dass das 
jetzt schon sehr nerdig sei oder er aufpassen müsse, dass das nicht allzu nerdig 
werde. Gleichzeitig ist das eine radiophone Plattform, die ein Hintergrundwissen 
und eine Kontextualisierung für die Hörerschaft möglich macht, denn neben dem 
Wissen um eine solche Dichte braucht es darüber hinaus ein spezifisches, ein ge- 
schultes, mithin ein emphatisches Hören, um ein Sample als Sample zu hören, zu 
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erkennen und gegebenenfalls einzuordnen, auch wenn es mittlerweile hilfreiche 
Instrumente wie whosampled.com gibt. 

Was hier anhand eines Einzelbeispiels nur sehr grobkörnig beschrieben wurde, 
ist im Kern ein Ansatz, der unter dem noch gar nicht systematisch ausgearbeiteten 
Begriff eines ‚Educated Radio‘ firmieren könnte. Ausgangspunkt hierfür ist die 
Frage, ob und ab wann ein Radio bildet. Notwendig ist hierfür die Annahme, dass 
das Radioangebot ereignishaft wahrgenommen wird und keinesfalls als Hinter- 
grundbeschallung bzw. -rauschen. Losgelöst von einer noch ausstehenden Rezi- 
pientenforschung wäre in diesem Fall weiterdenkend eine Modellierung möglich, 
die einen musikalischen Wissensbegriff mit ästhetischer Erfahrung verknüpft, die 
zumindest ausschnitthaft über die mediale Präsentation erstens den Zugang zu 
Musik, zweitens das Wissen über Musik als propositionales Wissen und drittens 
das Know-How-Wissen als prozedurales Wissen zu einem individuell gestaltetem 
Bildungsmoment vereint. Das ist alles andere als voraussetzungsarm, denn in den 
Blick zu nehmen ist dabei musikalische Fremderfahrung als eine Voraussetzung, 
die als Differenzerfahrung nicht nur aisthetisch, sondern eben auch ästhetisch 
wahrgenommen wird (vgl. Bugiel 2021). Staudacher moderiert nicht einfach nur 
ein Lied an und vermittelt moderativ vielleicht etwas über seine Entstehung, den 
Kontext, die Produktion oder seine gesellschaftspolitische Einordnung. Pointiert 
hebt er einzelne Musikmomente eines Liedes hervor und wiederholt diese gern 
auch noch einmal. So verändert sich die eher beiläufige Wahrnehmung eines 
Songs zu einer aufmerksamen, auf das Detail abhebenden, um dieses dann gege- 
benenfalls wiedererkennen zu können. Das bedeutet in diesem Sinne eine sub- 
stantielle Erweiterung musikalischer Wissensordnungen. Hans Jörg Sandkühler 
(2009, 76 f.) charakterisiert Wissensordnung allgemeintheoretisch als das 


„unterscheidbare, systemisch verfasste, holistisch (ganzheitlich) zu rekonstruie- 
rende Ensemble epistemischer und praktischer Kontexte, die bei der Entstehung 
und in der Dynamik von Wissen wirksam sind und Geltungsansprüche und Stan- 
dards der Rechtfertigung von Wissen bestimmen. Eingeschlossen ist ein ganz be- 
stimmter epistemischer Habitus, bestimmte Evidenzen, Perspektiven und weltbild- 
abhängige Präsuppositionen, bestimmte Überzeugungen, eigensinnige sprachliche, 
semiotische und semantische Üblichkeiten, besondere Auffassungen zu möglichen 
epistemischen Zielsetzungen, Fragen, Problemlösungen, kulturspezifischen Prakti- 
ken und Techniken und in diesem Kontext anerkannte Werte, Normen und Regeln.“ 
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Das lässt sich vielleicht nicht in seinem ganzheitlichen Anspruch, aber zumindest 
in der Perspektivierung, im Selbstverständnis und dem damit einhergehenden Ha- 
bitus auf das repräsentative Handlungsgefüge übertragen und so als habituelle 
Wissensform verstehen, die — soziologisch gesprochen — inkorporiert repräsen- 
tiert wird. Eine charmante und kurzweilige Weiterführung dieser Samplege- 
schichte findet sich dann im Youtube-Kanal, wenn 12 Finger Dan daraus Samp- 
lepingpong macht und in einem Clip von nicht mehr als einer Minute im Say-Say- 
Studio ein Original-Sample und dessen Verwendung kurz vorspielt. Frederick 
Staudacher und 12 Finger Dan sind in ihren Beiträgen zudem nah an aktuellen 
musikalischen Entwicklungen, die nicht einfach reproduziert werden, sondern 
aufgrund des eigenen umfangreichen Hintergrundwissens über DJs, Rapper*in- 
nen, Produzent*innen und Samples eine entsprechende Kontextualisierung erfah- 
ren. Das bedeutet im Weiteren, die eigenen Recherchequellen gegebenenfalls of- 
fenzulegen und das passiert ganz selbstverständlich in den Moderationen, wenn 
bspw. etwas Neues vorgestellt wird. Und hier sind es interessanterweise auch So- 
ziale Medien wie TikTok oder Plattformen wie Bandcamp, die als Quelle genutzt 
werden. 


8 Moderation und Sprache 


Sprechen im Radio ist etwas anderes als eine alltagssprachliche Interaktionssitu- 
ation, weil der Moderator in seiner Handlungsrolle immer eine Community, eine 
Hörerschaft imaginieren muss, um eine eigene Ansprechhaltung generieren zu 
können (vgl. Bose 2015). Ohne diese Imagination, die viel mehr der eigenen Hal- 
tung, der eigenen Lebenseinstellung, der eigenen Position ähnelt, um ein Grund- 
verständnis für das eigene Tun voraussetzen zu können, ohne sich immer neu er- 
klären zu müssen, geht es nicht. Moderation wäre damit mehr als eine reine 
Textpräsentation. Moderation als eigene Gesprächsform steht im Spannungsfeld 
zwischen konzeptioneller Schriftlichkeit und konzeptioneller Mündlichkeit. Sie 
entwickelt einen funktionalen Pluralismus mit Blick auf den Kommunikator, sie 
ist informativ-verbindlich angelegt und wirkt strukturierend wie verbindend (vgl. 
Häusermann 1998; Hess-Lüttich 2009). Für Say Say ließe sich über die kurze Cha- 
rakterisierung der Moderation hinaus außerdem das im HipHop grundständig ver- 
ankerte Prinzip des Each One Teach One einbinden. Dieses Prinzip verkörpert 
das so genannte fünfte Element des HipHop, das Knowledge, und ist nicht nur 
Kitt zwischen den vier anderen Elementen des HipHop, Breaking, MCing, DJing 
und Writing, sondern stellt vielmehr eine der Grundvoraussetzungen für eine le- 
bendige Kultur dar (vgl. Rappe 2017). Das ist eines von vielen Narrativen von 
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HipHop und lässt sich kritisch diskutieren. Sich jedoch als Teil der Kultur zu ver- 
stehen und diesen Teil im Sinne einer Wissensordnung zu reflektieren, impliziert 
eine Aktivität, die einerseits Respekt produziert, und zwar vor dem Gegebenen, 
der Tradition, dem HipHop-kulturellen Erbe, dem, was da alles besteht und damit 
verknüpft ist. Andererseits fordert dies einen Respekt gegenüber denjenigen ein, 
die noch nicht so oder in der Art und Weise etwas über HipHop wissen und in der 
aufgeschlüsselten Präsentation einen Zugang zu Musik und den Verbindungen 
bekommen. Daraus resultiert eine Anspruchshaltung, die sich nicht mehr und 
nicht weniger als eine Fortführung des Anspruchs verstehen lässt, wie sie der Rap- 
per KRS One: „Remember you must learn!” (KRS One MC’s Act Like They Don’t 
Know, 1995, Jive) immer wieder deutlich macht. 

Staudachers Sprechstil und Aussprache sind mit wenigen Dialekteinsprengseln 
eher der gemäßigten Standardsprache zuzuordnen, ohne dass sie in die Umgangs- 
sprache verfällt. Das ermöglicht eine Offenheit des Sprechens, die den Bezug zu 
sich selbst nicht als solipsistisch oder egozentrisch erscheinen lässt. Lemke (2020, 
o. S.) schreibt in der einschätzenden Beschreibung hierzu: „Vom Moderieren 
hatte Staudacher keinen blassen Schimmer, er redete einfach drauf los. Das Motto: 
Learning by Doing“. So gibt es keine Gute-Laune-Komik, wie sie oft in Morni- 
ngshows zu hören ist, weil man auf der Ebene der Erwartungserwartung glaubt, 
lustig sein zu müssen (vgl. Hoffmann 2014; Finke 2019). Das erhöht beim Say- 
Say-Hören die Glaubwürdigkeit und repräsentiert eine für die Hörerschaft durch- 
aus anschlussfähige Haltung. Es ließe sich noch ergänzen, dass das Moderieren 
oft einem selbstvergewissernden Sprechen nahekommt, was beim Hören dann so 
wirkt, als ob Staudacher sich jetzt selbst fragt, ob er das jetzt gerade richtig mache 
oder er gerade nicht genau wisse, was denn heute wieder los sei, weil er sich mitt- 
lerweile das dritte Mal versprochen habe. Gleichzeitig gibt es hörbar ein ‚fluffiges 
Mitrappen‘ bei offenem Mikrofon oder geteilte Erinnerungen an Titel, die emoti- 
onal miteinander verknüpft sind. Beispielsweise während einer Abmoderation des 
Titels von Gang Starr Discipline, bei dem Total gefeatured wurde und Staudacher 
in dem Zusammenhang einfiel, dass man ja mal wieder von Mase What you want 
spielen könne, weil bei diesem ja auch Total gefeatured wurde. Beide Titel liegen 
zudem zeitlich eng beieinander: Mase‘ Single kam 1997 heraus, die Kollaboration 
mit Gang Starr 1999. Versprecher, persönliche Vorlieben oder die interessegelei- 
tete Musikauswahl und Anekdoten produzieren eine Nähe zur Hörerschaft, die 
eine große Bindungskraft aufweist. Dabei geht es nicht um Massenkompatibilität, 
sondern um einen explizit artikulierten, realisierten Qualitätsanspruch. 

Beide Moderatoren haben entsprechende Routinen entwickelt. So beginnt Stau- 
dacher oft nach den Nachrichten mit einem langgezogenen „Gooo000d Morning“, 


© Frank & Timme Verlag für wissenschaftliche Literatur 141 


das von einem orchestral aufsteigenden Dur-Musiksample begleitet und mit ei- 
nem „Moin aus Hamburg“ ergänzt wird. 12 Finger Dan hingegen beginnt seine 
Moderationen zumeist mit einem „Was geht ab, liebe Leute“, ebenso haben sich 
die Abschlüsse von (fertig produzierten) Beiträgen oder von der Sendung an sich 
bei beiden Moderatoren in Redeweisen verfestigt: „Ich bin draußen, mein Name 
ist 12 Finger Dan, bis zum nächsten Mal, Ciao Raggazzi.‘“ oder von Staudacher: 
„Haudi Gaudi und bleibt soulful.“ 


9 _ Schlussbemerkung 


Der vorliegende Beitrag hat sich allgemein mit Radio als einem Programmange- 
bot und konkret mit dem Hamburger Radio Say Say — Soulful HipHop Radio als 
Nischenprogramm beschäftigt. Es ging dabei weniger um eine rezeptionsorien- 
tierte, linguistische oder sprechwissenschaftliche Analyse, vielmehr lag der Fokus 
auf dem Programm, um eine als notwendig erscheinende Perspektivkonturierung 
einbringen zu können. In dem Zusammenhang fällt auf, dass auch die Auseinan- 
dersetzung mit Musik in Forschungen zum Radio deutlich zu kurz kommt. Radio 
in seiner grundständigen Unterscheidung zwischen Einschalt- und Begleitpro- 
grammen zu begreifen, wird der Veränderung von Radio in einer digitalen Medi- 
enumgebung nicht mehr gerecht, gerade wenn es um Aspekte wie Hörerbildung 
und Community-Building geht. 

Die Morningshow, beziehungsweise der Zeitraum von 06.00 bis 10.00 Uhr, ist 
in Deutschland eine der Hauptnutzungszeiten von Radio (vgl. Finke 2019). Und 
aus Gründen von Nutzungsgewohnheiten wechseln Hörer*innen, wenn sie sich 
einmal entschieden haben, Sender nicht mehr allzu häufig. Das hat etwas mit der 
Ansprechhaltung der Sender zu tun, mit der Musikauswahl, dem Mood-Manage- 
ment, der Aufbereitung von Informationen in ihrer Breite und in ihrer Tiefe und 
natürlich ebenfalls mit der eigenen Radiosozialisation und den sich entwickelnden 
Vorlieben der Hörer*innen. Entsprechend hat Say Say die Morningshow als sein 
Flaggschiff ausgebaut. Verschiedene Programmelemente — wie das Sample des 
Tages — gestatten eine vorerst noch theoretische Überlegung, nämlich Aspekte 
informeller Bildungsprozesse beim Radiohören anzusiedeln. Intermediale Ver- 
netzungen durch Webseiten, soziale Medien und Datenbanken heben so das tran- 
sitorische Moment des Radiohörens auf und ermöglichen es, Wissenselemente 
diskursiv zu verankern. Dies wäre im Sinne eines ‚Educated Radios‘ weiter zu 
denken und auszubauen. 
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Was hier als eine Ausnahme in der deutschen Radiolandschaft wahrgenommen 
wurde, ließe sich als radiophone Verknüpfung einer Hingabe zur Musik, zur Hip- 
Hop-Kultur beschreiben und zudem als ein Versuch, in einer spezifisch medialen 
Form eine kulturelle Multiplikatorenrolle zu besetzen. Eingebunden ist dies in ein 
ökonomisches Modell, das sowohl auf Werbung als auch auf eine Community 
setzt, die das goutiert und wertzuschätzen weiß. Anders als ‚klassische Radiosen- 
der‘, die eine Programmschiene mit ‚Black Beats‘ (bspw. MDR Sputnik) im re- 
gulären Programm anbieten und sich dabei stärker an Mainstream und Charts ori- 
entieren, ist die Musik auf Say Say zentral mit dem Claim „Soulful Radio“ 
verknüpft. Es gibt eine hohe Identifikation der Macher*innen sowohl mit der Mu- 
sik als auch mit einer Haltung, die über eine reine Musikpräsentation hinausgeht. 
Die mediale Artikulation und Repräsentation des (Musik-)Programms bei Say Say 
stellt eine Dopplung über die diskursive Thematisierung dar: Radio in seiner plu- 
ralen Funktionalisierung als alltägliches Medienangebot sowie als ein Brücken- 
schlag in eine andere (Musik-)Kultur. 
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PELIONE: _ https://umzug.radiohelden.de/peli-one-home/ (11.03.2021) 

Satl regional: Warum ein erfolgreicher Anwalt hinschmiss. 07.11.2019, 
https://www.youtube.com/watch?v=t57eecFyyLg (11.03.2021) 

Say Say - Soulful HipHop Radio: https://say-say.de (11.03.2021) 

Shake!FM: _ https://www.shakefm.de (11.03.2021) 
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Sprach- und Sprechstil von Radionachrichten 
als advance organizer 


Heiner Apel, Aachen / Anna Schwenke, Greifswald 


Radionachrichten als Prototyp sachlich-informierender Gebrauchstexte werden 
innerhalb weniger Sekunden nicht nur als Nachrichten, sondern auch als Nach- 
richten eines bestimmten Sendeformats erkannt. Grund dafür ist, dass sich im 
Laufe des radiokulturellen Wandels Formulierungs- und Darstellungsprinzipien 
etabliert haben, welche die Besonderheiten des auditiv wahrnehmbaren Mediums 
berücksichtigen sowie gleichermaßen sender- und formatspezifisch variabel ge- 
deutet sowie umgesetzt werden. Darauf aufbauend kann die sprach- und sprech- 
stilistische Gestaltung von Nachrichten nach Göpferich (2006) als advance or- 
ganizer angesehen werden, der beim Erfüllen rezipienteninhärenter Erwartungen 
die Verständlichkeit der Nachrichten erhöhen kann. Anhand aktueller Ergebnisse 
sprechwissenschaftlicher Hörverständlichkeits- und Sprechstilforschung (Apel 
2018; Schwenke 2020) wird im vorliegenden Artikel das advance organizer-Prin- 
zip anhand von Radionachrichten diskutiert, insbesondere im Hinblick auf radio- 
rhetorische Fragen nach Angemessenheit, Zielgruppenorientierung und Wieder- 
erkennbarkeit. Abschließend werden Untersuchungsfragen formuliert, die 
konkrete Anknüpfungspunkte für Folgearbeiten darstellen. Damit wird das 
sprechwissenschaftliche Feld für eine umfassende Beschreibung und systemati- 
sche Auseinandersetzung mit sprach- und sprechstilistischen Merkmalen authen- 
tischer Radionachrichten umrissen. 


1 _ Verständlichkeitsoptimierung vs. Formatspezifik und Wie- 
dererkennbarkeit 


Ausgangspunkt dieses Beitrags sind Überlegungen von Göpferich zur Verständ- 
lichkeitsoptimierung von Texten. Göpferich (2006, 160 f.) führt aus: 


„Ein mentales Konventionsmodell steuert [...] bei einem Rezipienten, der mit der 
Textsorte zumindest rezeptiv vertraut ist, auch die Informationsaufnahme aus dem 
Text und damit das Verstehen. Das mentale Konventionsmodell fungiert als eine 
Art advance organizer [...], der es dem Rezipienten erleichtert, die Informationen, 


die er aufnimmt, in einen Zusammenhang zu bringen, es steuert seine Erwartungen 
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zu dem, was im Text als nächstes behandelt wird, und auch zur Art der Versprach- 
lichung (Stil, Fertigstücke, Terminologie etc.), in der dies geschieht“ [Hervorhe- 
bung i. O.]. 


Der Begriff des advance organizers wurde von Ausubel (1960) im Rahmen der 
Erforschung des Lernens durch Texte eingeführt. Das Konzept, das dem advance 
organizer zugrunde liegt, beschreibt er folgendermaßen: „learning and retention 
of unfamiliar but meaningful verbal material can be facilitated by the advance 
introduction of relevant subsuming concepts (organizers)‘“ (ebd., 267). Ballstaedt 
(1997, 23) bezeichnet daran anknüpfend den advance organizer als eine Art „kog- 
nitive Vorstrukturierung“, die „beiden Adressaten Vorwissen [aktiviert] und [...] 
eine begriffliche Brücke [schlägt] zwischen alten und neuen Informationen“. D. h. 
durch eine kognitive Vorstrukturierung wird versucht, das Vorwissen der Rezipi- 
ent*innen mit den neu vermittelten Inhalten in Verbindung zu bringen. Wenn nun 
das „mentale Konventionsmodell“ — wie es Göpferich (2006, 160 f.) vorschlägt — 
als kognitive Vorstrukturierung fungieren soll, bedeutet das, dass Rezipient*in- 
nen, wenn sie eine bestimmte Textsorte erkennen, spezifische Textsorten-Kon- 
ventionen bzw. Textsorten-Schemata mental aufrufen und somit eine charakteris- 
tische Rezeptionserwartung an diese Texte entwickeln (vgl. ebd.). Mentale 
Konventionsmodelle können dabei z. B. „Schemata zur konventionellen Gliede- 
rungsstruktur von Textsorten, der sog. Makrostruktur, zu textsortenspezifischen 
standardisierten Formulierungen (syntaktischen Fertigstücken oder Textversatz- 
stücken) [umfassen]“ (ebd.). Solche Konventionsmodelle sind jedoch nicht allein 
auf schriftliche Texte beschränkt, sondern können natürlich ebenso in mündlicher 
Form, z. B. die Realisierung einer konkreten prosodischen Gestaltung betreffend, 
oder ggf. in nonverbaler Kommunikation auftreten. 

Bezogen auf Radionachrichten heißt das, dass Nachrichtenhörer*innen eben- 
falls Rezeptionserwartungen an die Gestaltung der Nachrichten eines vertrauten 
Senders bzw. eines gewohnten Sendeformats haben. Werden diese Erwartungen 
erfüllt und entsprechen die Nachrichten den vertrauten Hörmustern, wird das Ver- 
stehen der Nachrichten erleichtert (vgl. ebd., 161). Werden die Rezeptionserwar- 
tungen allerdings nicht erfüllt, indem die Nachrichten anders als gewohnt gestaltet 
sind (z. B. anders geschrieben, gesprochen oder strukturiert), kann das Verstehen 
der Nachrichten erschwert werden. Göpferich (ebd.) erklärt dies damit, dass 


„mentale Konventionsmodelle so lange im Unterbewußtsein des Rezipienten blei- 


ben und damit auch keine Verarbeitungskapazität im Arbeits- bzw. Kurzzeitge- 


dächtnis beanspruchen, wie sie in dem Text, den er rezipiert, eingehalten werden. 
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Verstöße gegen sie hingegen enttäuschen die Erwartungen des Rezipienten, was 
dazu führen kann, daß das jeweilige mentale Konventionsmodell in Auszügen in 
das Bewußtsein des Rezipienten ‚geladen‘ wird und somit top-down-Prozesse in 
Gang kommen, die beispielsweise zu Interpretationsversuchen für diese Konventi- 


onsverstöße führen“ [Hervorhebung i. O.]. 


Diese Überlegungen korrespondieren mit den Ergebnissen der Studie von Finke 
(2019, 305 ff.), die sich mit Radiomoderationen in der Primetime beschäftigt hat 
und festhält, dass in den Moderationen bestimmte Muster realisiert werden, die 
zwar einen gewissen (sender-)individuellen Stil ausprägen und kleine Überra- 
schungen im Sendeverlauf bieten, sich jedoch senderübergreifend stark ähneln. 
So ergibt sich eine formatspezifische Konventionalität der Moderationen, die zum 
einen von Produzentenseite aus gewollt ist und zum anderen von Seiten der Hö- 
rer*innen erwartet wird (ebd., 316 f.): In den Moderationen „soll Alltag präsen- 
tiert werden, der grundsätzlich keine ‚Zumutungen‘ bereithält, sondern eher 
‚harmlos‘ anmutet. [...] Im Vordergrund stehen damit Durchhörbarkeit, Einstim- 
mung auf den Tag und Sicherheit in der Erwartbarkeit“ [Hervorhebung d. A.] 
(ebd., 318). 

Allerdings — und dies betrifft das Spannungsfeld, das der vorliegende Artikel 
umreißt — stellt diese Rezeptionserwartung an die Gestaltung von Radionachrich- 
ten für das Ziel der Verständlichkeitsoptimierung auch ein Problem dar. Mittler- 
weile haben sich im Rahmen der relativ langen Auseinandersetzung mit der Pro- 
duktion verständlicher Nachrichten (vgl. z. B. Böhm et al. 1972, Straßner 1975; 
Lutz / Wodak 1987; Hardt-Mautner 1992; Kindel 1998; Gutenberg 2005; Apel 
2018) Regeln und Konventionen einer verständlichen Nachrichtensprache und ei- 
nes verständlichen Nachrichtensprechens herausgebildet. U.a. mündeten die 
Überlegungen zu verständlichen Nachrichten in das Projekt zur Hörverständlich- 
keit von Radionachrichten der Martin-Luther-Universität Halle-Wittenberg und 
des MDR Radio Sachsen-Anhalt (vgl. Bose 2009; Bose et al. 2011). Die formu- 
lierten Regeln haben schon seit Längerem Eingang auch in die Ausbildung von 
zukünftigen Journalist*innen gefunden (vgl. z. B. Immel 2014; Schwiesau / Ohler 
2016). 

Problematisch daran ist nun, dass sich die Konventionen einer verständlichen 
Nachrichtengestaltung in überwiegendem Maße auf textinterne Faktoren bezie- 
hen, d.h. auf sprachliche und sprecherische Faktoren der Nachrichten (vgl. 
Schwiesau / Ohler 2016, 99 ff.). Textexterne Faktoren wie z. B. Adressatenkreis, 
Sender, kommunikative Funktion sowie mentales Konventionsmodell der Rezi- 
pient*innen werden aber bei der Verständlichkeitsoptimierung häufig außer Acht 
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gelassen (vgl. Apel 2018, 118 ff.). Dem Karlsruher Verständlichkeitsmodell fol- 
gend (vgl. Göpferich 2006, 154 ff.) spielt die Berücksichtigung solcher textexter- 
ner Faktoren jedoch schon bei der Produktion von verständlichen Texten eine we- 
sentliche Rolle. D. h. es kann sein, dass Nachrichten in einer verständlichkeits- 
optimierten Realisierung mit den Rezeptionserwartungen der Hörer*innen eines 
spezifischen Senders konfligieren und somit trotz einer an Verständlichkeitsre- 
geln orientierten Nachrichtengestaltung dennoch von den Rezipient*innen nicht 
als verständlich eingeschätzt werden. Beispielsweise kann für die Stammhö- 
rer*innen eines spezifischen Senders eine eher komplexe sprachliche Gestaltung, 
welche die Seriosität der Nachrichten betont, aufgrund der Gewöhnung an diese 
formatspezifische Realisierung verständlicher sein als eine zwar einfacher ge- 
schriebene, jedoch ‚moderner‘ anmutende Nachrichtensendung mit vielen musi- 
kalischen Elementen und dialogischen Einspielern eines anderen Senders. 


Wenn wir hier nun grundlegend fragen, ob der Sprach- und Sprechstil von Radio- 
nachrichten als advance organizer für das mentale Konventionsmodell von Rezi- 
pient*innen dienen kann, dann kann demzufolge die Antwort nur lauten: sowohl 
ja als auch nein. Ja, weil die sprachliche und sprecherische Gestaltung von Nach- 
richten einen Faktor des mentalen Konventionsmodells der Rezipient*innen eines 
Radiosenders darstellt und wenn der erwartete Nachrichtensprach- und Sprechstil 
realisiert wird, dieser als kognitive Vorstrukturierung verständlichkeitsfördernd 
wirken kann. Nein, weil es bei Veränderungen des Sprach- und Sprechstils von 
Radionachrichten bspw. aus Gründen der Verständlichkeitsoptimierung zu einer 
Nicht-Erfüllung der Rezeptionserwartung der Rezipient*innen kommen kann und 
demzufolge die stilistische Gestaltung der Nachrichten nicht mehr als advance 
organizer und Verständlichkeitsunterstützung wirkt. Hieraus entsteht ein Span- 
nungsgefüge aus 1. den allgemeinen Konventionen der Nachrichtengestaltung 
wie sie z. B. Burger / Luginbühl (2014, 255 ff.) beschreiben, 2. einer format- bzw. 
senderspezifischen Realisierung dieser konventionalisierten Gestaltung mit Wie- 
dererkennungswert und 3. den Anforderungen, welche die Standards der Nach- 
richtenproduktion an eine möglichst verständliche Nachrichtensprache sowie ein 
möglichst verständliches Nachrichtensprechen stellen. 


In den kommenden Abschnitten möchten wir folgende Fragen aufwerfen: 


- Wird der Sprechstil von Radionachrichten von Hörer*innen sender- bzw. 
formatspezifisch erkannt und zugeordnet (was ein deutliches Indiz für ein 
mentales Konventionsmodell ist, das ausschließlich den Sprechstil von Ra- 
dionachrichten betrifft)? (Abschnitt 2) 
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- Welche Möglichkeiten haben Sender unterschiedlicher Formate, um eine 
inhaltlich gleiche Meldung sprachlich unterschiedlich zu verfertigen (was 
ein Hinweis auf eine sender- bzw. formatspezifische Konvention in der 
Nachrichtensprache wäre)? (Abschnitt 3) 

- Welche weiteren Gestaltungsmöglichkeiten der Nachrichtenrealisierung 
gibt es, die als Einflussfaktoren für eine verständliche Gestaltung der Nach- 
richten genutzt werden könnten (was als Ausblick auf Anschlussuntersu- 
chungen zu verstehen ist)? (Abschnitt 4) 


Die folgenden Aussagen und Darstellungen (v. a. in Abschnitt 2) beziehen sich 
auf ein speziell designtes und umfassend beschriebenes quasiauthentisches Test- 
material, das im Rahmen des Forschungsprojekts zur Hörverständlichkeit von Ra- 
dionachrichten der Martin-Luther-Universität Halle-Wittenberg entwickelt wurde 
(vgl. Bose et al. 2011). Radiojournalist*innen haben zwei realistische Textvari- 
anten einer thematisch fiktiven Nachrichtensendung geschrieben: eine leicht und 
eine schwer verständliche Testsendung. Diese wurden von zwei Sprecherinnen 
und zwei Sprechern unter Anleitung eingesprochen, um den Einfluss des Zusam- 
menhangs von Sprach- und Sprechfassung auf das Behalten und Verstehen der 
Nachrichten empirisch zu untersuchen (vgl. Apel 2018). Außerdem wurden die 
Testsendungen von Nachrichtensprecher*innen verschiedener Sender und For- 
mate eingesprochen; 66 dieser Sprechversionen liegen der Beschreibung der Aus- 
prägungen eines formatspezifischen Sprechstils zugrunde (vgl. Schwenke 2020). 


2 Ausprägungen eines formatspezifischen Sprechstils als ad- 
vance organizer 


In der Auseinandersetzung mit gesprochenen Radionachrichten verweist der 
Sprechstilbegriff aus sprechwissenschaftlicher sowie radiorhetorischer Sicht auf 
die Besonderheiten sprecherisch-stimmlicher Merkmale sowie den Einsatz 
sprechtechnischer Mittel — mit Fokus auf der Wahrnehmung formatabhängiger 
Unterschiede. Bei der Verwendung des Stilbegriffs wird davon ausgegangen, dass 
Stil holistisch (vgl. Sandig 2006) sowie absichtsvoll-rhetorisch ist (vgl. Fix 2007) 
und kreative Gestaltungsmöglichkeiten bietet (siehe ausführlich Schwenke 2020, 
168 ff.). Grundsätzlich wird in Anlehnung an Bose (2013, 155) davon ausgegan- 
gen, dass Radionachrichten als medienbezogene Kommunikationsformen „inten- 
tional auf Wirkung ausgerichtet“ sind, „auf gelernten Mustern“ basieren sowie 
„als Produkt rhetorischer techne“ gelten. Für die Analyse journalistischer Darstel- 
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lungsformen wie Radionachrichten im Allgemeinen und die Beschreibung for- 
matspezifischer Sprechstile im Besonderen bieten sich drei wissenschaftliche Zu- 
griffsmöglichkeiten an: Produzent*innenperspektive, Produktanalyse und Rezipi- 
ent*innenperspektive. 

Insbesondere durch die Verbindung dieser drei Perspektiven können die Rhe- 
torizität von Radionachrichten sowie die Ausprägungen eines formatspezifischen 
Sprechstils deutlich gemacht werden: Ausgerichtet auf eine vorher definierte Ziel- 
gruppe und orientiert an bestimmten formalen Vorgaben mündet ein absichtsvol- 
ler Gestaltungsprozess final in das Medienprodukt Radionachrichten. Dafür lässt 
sich ein definierter Nachrichtensprechstil beschreiben, welcher hörbar wird, an 
definierten Merkmalen beschreibbar ist und damit nicht nur von anderen massen- 
medial vermittelten Darstellungsformen im Radio abgegrenzt werden kann, son- 
dern auch eine Untergliederung in nachrichtliche Subtypen möglich macht (siehe 
unten). Rezipient*innen sind wiederum in der Lage, sprecherische Ereignisse von 
anderen zu unterscheiden und diese damit als stilbildend wahrzunehmen und zu 
benennen. 


Um diese triadische Beschreibung des Sprechstils, d. h. die Beschreibung aus al- 
len drei Perspektiven möglich zu machen, wurden bestimmte Untersuchungsme- 
thoden kombiniert (vgl. Schwenke 2020, 216 ff.): 


- Auditiv-akustische Analyse: Auf Grundlage des Testmaterials des For- 
schungsprojekts zur Hörverständlichkeit von Radionachrichten der Martin- 
Luther-Universität Halle-Wittenberg (vgl. Bose et al. 2011) wurden 66 
Sprechversionen erhoben: 31 Sprecher*innen haben die einfach geschrie- 
bene Testsendung N1 gesprochen und 35 die kompliziert geschriebene 
Testsendung N2. Die 66 Sprechversionen wurden nach Gliederungs- und 
Akzentuierungsmerkmalen, Sprechtempo und Pausengestaltung sowie 
Grundfrequenz analysiert. 

- Schriftliche Befragung von Nachrichtensprecher*innen: Nach dem Spre- 
chen einer der Textvarianten wurden die Sprecher*innen gebeten, einen 
Fragebogen auszufüllen. Insgesamt wurden 93 Sprecherfragebögen zur 
Aufnahmesituation, zur Einschätzung der Textvarianten (Sprechbarkeit, 
Realitätsnähe) sowie zum Arbeitsalltag und zu Idealen bei der Vorberei- 
tung und Sprechen von Nachrichtentexten erhoben. 

- Hörexperiment mit schriftlicher Befragung: Im abschließenden Untersu- 
chungsschritt wurde ein Experiment zur hörerseitigen Identifikation des 
Formatbezugs durchgeführt. 160 Hörer*innen haben ausgewählte Beispiele 
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von Sprechversionen der Textvariante N2 bestimmten Vorgaben zugeord- 
net (Organisationsform: Privatsender, öffentlich-rechtlicher Sender; For- 
mat: Info, Kultur, Unterhaltung, Sonstiges; Zielgruppe: Jugendsender, Sen- 
der für Senioren, Sonstiges) und ihre Zuordnung begründet (z.B. 
Stimmklang, Sprechtempo, Wirkung) (zur Konzeption des Experiments 
und zur Fragebogenerstellung vgl. Schwenke 228 ff.). 


Mithilfe dieser Methodenkombination und anhand der ermittelten Daten werden 
die folgenden Fragen für den Zusammenhang des advance organizer-Prinzips mit 
dem Sprechstil von Radionachrichten aufgegriffen und bearbeitet: 


2.1 


Erwartungshaltungen und Idealvorstellungen: Welche Erwartungen haben 
Hörer*innen? Was sind Idealvorstellungen von Sprecher*innen? 
Angemessenheit von Radionachrichten: Was bedeutet eine angemessene 
Präsentation von Nachrichten? 

Einfluss von Nachrichtensprechstilen auf die Wiedererkennbarkeit von 
Sendeformaten: Lassen sich Grundtypen definieren, die als advance orga- 
nizer fungieren (könnten)? 


Erwartungshaltungen und Idealvorstellungen in Bezug auf Radio- 
nachrichten 


Die Aussagen darüber, was Hörer*innen von Radionachrichten erwarten, ist dem 
Hörexperiment entnommen, in dem 160 Proband*innen unterschiedliche Hörbei- 
spiele des Korpus aus 66 Sprechversionen mit identischer Textgrundlage be- 
stimmten Formatvorgaben zugeordnet haben. Das Hörexperiment endete mit der 
offenen Frage danach, wie Nachrichten sein sollten. Hörerin 113 hat dies bei- 
spielsweise so beantwortet: 


„Mit gemäßigter Betonung; von einer fröhlichen, warmen Stimme gesprochen; 
Aussprache sollte nicht gewollt verstellt werden (übermäßige Betonung, langziehen 
von Wörtern etc.).“ 


Insgesamt haben 110 Proband*innen diese Frage beantwortet; es liegen 345 
Einzelnennungen vor, die für eine Gesamtübersicht zunächst geclustert und 
unter 33 Schlagwörtern zusammengefasst wurden. Dargestellt sind die 
Schlagwörter als Wortwolke mit der Open-Source-Software word-it-out 
(vgl. Schwenke 2020, 337; siehe Abbildung 1): 
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sinnbetont informativ 


aktuell prägnan 


: hörerorientiert ardlauı 
mittelschnell . SENSE? 
überblicksartig deutlich 
Hr interessant ruhig 


u. sachlichnachvoizienbar 


gut strukturiert ku fZseriös 
neutral knapp relevantausgewogen 


angenehme Stimme wie typischer Infosender 
kompetent | ,. : 
langsam Hintergrundinfos 
authentisch weniger häufig wiederholt 
präzise au . 
oey verständlich 
natürlich gesprochen 
Abb. 1: Erwartungen von Hörer*innen an Radionachrichten (vgl. Schwenke 2020, 337) 


Viele der Befragten erwarten von Radionachrichten, dass sie kurz (41 Nennun- 
gen), informativ (38 Nennungen) und außerdem verständlich (20 Nennungen) 
sind. Dies ließe sich gleichsam als Minimaldefinition für den nachrichtlichen Prä- 
sentationsstil heranziehen. Interessant sind deshalb die anderen verschlagworteten 
Nennungen, die Rückschlüsse auf formatspezifische Hörer*innenerwartungen zu- 
lassen. Diese können angesichts der gegrenzten Stichprobe zwar nicht verallge- 
meinert werden, deuten aber gewisse Tendenzen an (vgl. Schwenke 2020, 338): 


- Für eine Gruppe der Befragten sollen Radionachrichten v. a. sachlich, deut- 
lich, ausführlich sein. Die Erwartungen an eine sachlich-seriöse Form be- 
treffen Merkmale einer deutlichen und ruhigen Sprechweise und die Unter- 
fütterung aktueller Themen mit Hintergrundinformationen. 

- Für eine andere Gruppe der Befragten sollen Radionachrichten authentisch, 
natürlich, knapp sein: Diese Erwartungen betreffen dann z. B. eine ange- 
nehme Stimme und eine natürliche Sprechweise. Außerdem wird ge- 
wünscht, dass die für die Zielgruppe relevanten Themen knapp und präg- 
nant dargestellt werden. 


Im Rahmen der Untersuchung zum Sprechstil und zur Hörverständlichkeit von 
Radionachrichten wurden diese Beobachtungen zunächst als Nebenbefund proto- 
kolliert; Folgearbeiten könnten hier anschließen und der Frage nachgehen, inwie- 
weit die Hörer*innenerwartungen (bzw. Präferenzen und Gewohnheiten) mit be- 
stimmten Nachrichtensprechstilen oder prosodischen Besonderheiten harmo- 
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nieren oder konfligieren, wenn es um Aspekte hörverständlicher Präsentation 
geht. 


Die Aussagen darüber, was Sprecher*innen als Idealvorstellung formulieren, 
sind der Sprecher*innen-Umfrage entnommen, die im Anschluss an das Einspre- 
chen der Testsendung erfolgte. U. a. wurde gefragt, was beim Nachrichtenspre- 
chen als besonders wichtig bewertet wird (vgl. Schwenke 2020, 225). Diese of- 
fene Frage haben 80 der 84 befragten Sprecher*innen mit 198 Nennungen 
beantwortet, die anschließend fünf Kategorien zugeordnet werden konnten (Hö- 
rerorientierung, hörverständliches Sprechen, Textfluss, Atmosphäre und Sende- 
bedingungen; vgl. ebd., 278). Insbesondere diejenigen 145 Aussagen von 54 Spre- 
cher*innen, die in die Kategorien Hörerorientierung, hörverständliches Sprechen 
und Textfluss fallen, referieren auf Idealvorstellungen des Nachrichtensprechens. 
In Abbildung 2 sind diese Aussagen als Schlagwörter geclustert in einer Wort- 
wolke dargestellt. 


Nachrichten erzählen 


exakte Betonung... wecken 
gemäßigtes Tempo sinzus; r 


Hörverständlichkeit Fehlerfreiheit 
Standardlautung ' 


Freundlichkeit naaa e Narna it 
Verständlichkeit 
verständlich gliedern züsi 


froe Stimme “ Zuhören erleichtern 
1 PE EIKER 


richtige Atmung 


Paus sen 
Kompetenz “Seriosität D 


Sprech-Denken otning 
e Deutlichkeit 
Abb. 2: Idealvorstellungen von Sprecher*innen an das Nachrichtensprechen (vgl. Schwenke 
2020, 335) 


Deutlich wird, dass es den Sprecher*innen v. a. um die hörverständliche Präsen- 
tation der Meldungen geht: Verständlichkeit wurde mit 18 Nennungen am häu- 
figsten genannt, welche z. B. erreicht wird durch exakte Betonung, verständlich 
gliedern, Deutlichkeit und gemäßigtes Tempo, um das Zuhören [zu] erleichtern. 
Daneben wurde auch die Hörerbindung (6 Nennungen) explizit genannt und ei- 
nige gaben an, dass es auch darum geht, die Nachrichten [zu] erzählen und 
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sprechdenkend vorzutragen (6 Nennungen), d. h. „selbst den Sinn begriffen ha- 
ben“ (Sprecher 11, Jugendsender). Sprecher 22 (Infosender) hielt fest: „Alles muss 
durch meinen Kopf, damit ich gut gliedern kann und das flüchtige Wort auch beim 
Hörer ankommt.“. Dies deutet darauf, dass sich die Idealvorstellungen nicht aus- 
schließlich auf das bloße Verlautlichen der Nachrichtentexte beziehen. Vereinzelt 
wurde auf metaphorische oder dramaturgische Elemente verwiesen: z.B. „for- 
matspezifische, textsortenspezifische Anmutung“, „Glaubwürdigkeit“, „Drama- 
tik“, „Relevanz“ oder „angenehmer Gesamteindruck“ (einzelne Nennungen). Ei- 
nige Sprecher*innen haben sich auch explizit auf Freundlichkeit und 
Natürlichkeit der Nachrichtenpräsentation bezogen, die einem Eindruck von Se- 
riosität (4 Nennungen) und Kompetenz jedoch nicht widersprechen sollen. 


2.2 Angemessenheit der sprecherischen Präsentation von Nachrichten 


Zur Beantwortung der Frage nach der Angemessenheit verschiedener sprecheri- 
scher Präsentationsmöglichkeiten von Nachrichten wurden die erhobenen Sprech- 
versionen zunächst mit sprechwissenschaftlichen Angemessenheitsvorstellungen 
verglichen, die als sog. Partiturfassungen innerhalb des Forschungsprojekts zur 
Hörverständlichkeit von Radionachrichten entwickelt wurden und Hinweise zu 
Akzent- und Gliederungsstellen liefern (vgl. Bose et al. 2011, 41 ff.). Die Anlage 
dieser Partiturfassungen erfolgte aufgrund sprechwissenschaftlicher Hypothesen 
zum Schreiben und Sprechen von Radionachrichten (vgl. Gutenberg 1994, 28 £.): 
Die Partitur P1 ist als Idealversion und die Partitur P2 als größtmögliche Abwei- 
chung vom Ideal erstellt worden. Damit sind beide Partiturfassungen als extreme 
Vorlesevorgaben zu verstehen, die zur kritischen Prüfung sprechwissenschaftli- 
cher Angemessenheitsvorstellungen dienen: Geprüft wurde, ob die Gesamtheit 
der Sprechversionen von N1 und N2 eher mit Pl oder eher mit P2 korrespondiert. 
Es zeigt sich, dass sowohl die Sprechversionen von N1 als auch von N2 im Durch- 
schnitt nicht mit den sprechwissenschaftlichen Idealsprechversionen (N1.P1 und 
N2.P1) übereinstimmen: Die Sprecheinheiten sind im Durchschnitt deutlich län- 
ger, als es die sprechwissenschaftlichen Idealfassungen vorsehen. Auch die Ak- 
zentuierung weicht stark von der Idealvorstellung ab; jedoch tritt das vermutete 
Ausmaß an Akzenthäufungen der Partitur P2 nicht ein (vgl. ausführlich Schwenke 
2020, 320 ff.): 
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Textvariante vs. Partitur | N1* | N1.P1 | N1.P2 | N2* | N2.P1 | N2.P2 
*für NI und N2 Angabe der Durchschnittswerte der Sprechversionen 
Anzahl der Sprecheinheiten | 45 75 54 44 |77 51 
Mittlerer Umfang der Sprecheinheiten | 16,6 | 8,8 13,5 22,0 | 12,3 17,9 


(in Silben) 

Akzentanzahl | 175 | 75 215 184 | 77 247 

Mittlere Akzentanzahl pro Sprech- | 3,9 1 3,9 43 |1 4,7 
einheit 


Mittlerer Akzentabstand (in Silben) | 4,2 9,9 3,4 5,2 | 12,3 3,8 
Tab. 1: Basisdaten der Sprechversionen N1 und N2 im Vergleich mit den Partiturfassungen 


Auf Grundlage dieser Daten könnte man davon ausgehen, dass die Sprecher*in- 
nen die sprechwissenschaftlichen Angemessenheitsvorstellungen an hörverständ- 
liche Nachrichten im Durchschnitt nicht erreichen. Diese Schlussfolgerung greift 
aber nicht nur deshalb zu kurz, weil es durchaus Sprechversionen von N2 gibt, die 
der Idealversion Pl sehr nahekommen bzw. es Sprecher*innen gelungen ist, den 
Text im Sinne sprechwissenschaftlicher Idealvorstellungen hörverständlich zu 
präsentieren (abhängig von der sprecherischen Erfahrung und dem jeweiligen 
Ausbildungsstand; vgl. Schwenke 2020, 323 ff.). 

Vielmehr verweisen die „Abweichungen“ auf die Möglichkeit einer formatab- 
hängigen Deutung der Datenlage. Denn insbesondere in der Ausrichtung eines 
Senders auf eine anvisierte Hörergruppe lässt sich die Frage nach der wahrgenom- 
menen Angemessenheit (aptum) stellen, die durch die Gestaltung formatspezifi- 
scher Realisierungsformen als relationale Kategorie zu verstehen ist (vgl. 
Schwenke 2020, 160). Sicherlich endet die Gestaltungsfreiheit dort, wo dem An- 
spruch an verständliches und objektives Informieren als Grundfunktion von 
Nachrichten nicht mehr entsprochen werden kann (vgl. ebd., 28 ff. und 40 ff.). 
Innerhalb dieses Rahmens ist aber ein gewisser Spielraum gegeben und Ange- 
messenheitsvorstellungen zeigen sich als verhandelbar: Das Radionachrichten- 
produkt wird durch die Themenauswahl und die sprachliche Gestaltung sowie 
durch die Nutzung von Klang- und Musikelementen sender- und formatabhängig 
designt (siehe Abschnitte 3 und 4). Vor dem Hintergrund radiomarktwirtschaftli- 
cher Entscheidungen lässt sich für die Interpretation der dargestellten Daten dem- 
nach auch fragen, inwieweit die erhobenen Sprechversionen, die ohne Vorgaben 
und ohne Anwesenheit der Untersucherin am individuellen Arbeitsplatz der Spre- 
cher*innen entstanden sind, unter dem Eindruck senderinterner Angemessen- 
heitsvorstellungen standen. 
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Die Kontrastierung der Sprechversionen mit den sprechwissenschaftlichen Ideal- 
vorstellungen (Partiturfassungen) stellt(e) daher die grundlegende Zugangsmög- 
lichkeit dar, um Hörverständlichkeit von Radionachrichten zu verorten und um 
zunächst zu prüfen, inwieweit sich die präskriptiven Vorgaben empirisch validie- 
ren lassen. So konnte für den Einfluss der Textgrundlage auf die sprecherische 
Präsentation nachgewiesen werden, dass der leicht verständlich geschriebene 
Text N1 (in Umfang und Dauer) deutlich kürzere Sprecheinheiten provoziert als 
der kompliziert geschriebene Text N2 (vgl. Schwenke 2020, 239). Für die Ak- 
zentverteilung und -anzahl lässt sich nicht nur nachweisen, dass diese Parameter 
wenig bis gar nicht von der Textgrundlage beeinflusst werden (ebd., 244 f.), son- 
dern auch, dass sich die Sprechversionen von N1 und die Sprechversionen von 
N2 so sehr in ihrer Akzentstruktur gleichen, dass von einem nachrichtentypischen, 
textunabhängigen und stabilen Akzentverteilungsmuster ausgegangen werden 
muss (ebd., 249). 

Ein klarer Hinweis darauf, dass Regeln zum hörverständlichen Sprechen for- 
matspezifisch interpretiert und hörerorientiert variiert werden, zeigt sich insbe- 
sondere in der Pausenzeitgestaltung und in der mittleren Sprechstimmlage sowie 
dem Sprechtonhöhenumfang: 


- Nachweisbar ist eine formatspezifische Pausengestaltung bei nachrichten- 
typisch hohen Artikulationsraten, d. h. die Auswertung und der Vergleich 
der reinen Sprechzeit exklusive Pausen machen keinen formatabhängigen 
Unterschied deutlich, wohl aber die Analyse der Pausenzeit und -vertei- 
lung, welche sich als klare substilbildende Merkmale zur Formatabgren- 
zung beschreiben lassen: Die beteiligten Sprecher*innen von Info- und Ser- 
vicesender realisieren häufigere und längere Pausen als die Sprecher*innen 
von Jugend- und Privatsendern (ebd., 256). 

- Formatunterschiede lassen sich auch für die Parameter Sprechtonhöhe und 
Tonhöhenumfang als Marker für „Seriosität“, „Jugendlichkeit‘“ und „At- 
traktivität“ beschreiben: Beobachtet werden können tiefe Frauenstimmen 
bei Infosendern, relativ hohe Männerstimmen bei Jugendsendern und „spe- 
zielle“ Stimmen bei Privatsendern (ebd., 259 ff.). 


Diese hier kurz beschriebenen formatspezifischen Unterschiede geben Anlass, 
formatspezifische Angemessenheitsvorstellungen konkret zu beschreiben und im 
Hinblick auf bzw. Wechselwirkung mit Hörverständlichkeitsprinzipien zu unter- 
suchen (v. a. im Zusammenhang mit den sprachlichen Besonderheiten formatspe- 
zifischer Nachrichtentexte). 
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2.3 Einfluss von Nachrichtensprechstilen auf die Wiedererkennbarkeit 
von Sendeformaten 


Im Rahmen der Untersuchung von Nachrichtensprechstilen diente das Hörexpe- 
riment vorrangig der Analyse der Stilwahrnehmung aus Rezipient*innensicht. 
Untersucht wurde, ob Hörer*innen in der Lage sind, Ausschnitte der Sprechver- 
sionen, die sich lediglich im Sprechstil unterscheiden, bestimmten Formatvorga- 
ben zuzuordnen. Darüber hinaus wurde es auch als Korrektiv der als nachrichten- 
typisch oder formatspezifisch beschriebenen sprecherischen Merkmale sowie als 
Test der behaupteten Nachrichtenstil-Subtypen (Info, Jugend, Privat und Service) 
genutzt (ebd., 280). 

In einem ersten Schritt wurde die Übereinstimmung der Zuordnungen geprüft. 
Übereinstimmend zugeordnet heißt, dass die Hörer*innen sich für Formatkatego- 
rien entschieden haben, die sich mit dem tatsächlichen Radioformat decken, wel- 
ches die oder der jeweilige Sprechende als Hauptsender angegeben haben (ebd., 
287). Dann wurden die Zuordnungshäufigkeiten aller 160 Befragten geordnet 
nach Zuordnungskategorie (Organisationsform, Format i. e. S. und Zielgruppe) 
zusammengefasst. Die folgende Tabelle (Tabelle 2) enthält eine ausgewählte Zu- 
sammenstellung von Mittelwerten der Zuordnungshäufigkeiten pro Format- 
gruppe (die Datentabelle findet sich in Schwenke 2020, 403 ff.): 


Formatgruppen INFO / SER- JUGEND | PRIVAT 
der Hörbeispiele KULTUR VICE 
Beispielanzahl 12 5 8 7 
zugeordnet als: Mittelwert der Zuordnungshäufigkeiten in Prozent 
Organisa- | öffentlich-rechtlich 72,5 72,8 26,6 22,3 
tionsform | Privat 22,6 23,8 68,1 69,4 
Programm | Info / Kultur 75,5 64,0 29,4 30,8 
Unterhaltung 15,4 28,8 59,6 56,6 
Zielgruppe | Jugend 8,2 11,7 45,5 40,8 
Senioren 24,0 19,3 4,7 3,5 
alle / Erwachsene 35,3 24,7 26,6 27,1 
keine Angabe 27,5 35,1 20,8 23,0 


Tab. 2: Durchschnittliche Zuordnungshäufigkeiten pro Formatgruppe im Hörexperiment 
In der Betrachtung der Zuordnungshäufigkeiten für die einzelnen 32 Hörbeispiele 


konnten zusammen mit den Einschätzungswerten der Zuordnungssicherheit 
(leicht, mittel, schwierig) 14 sicher zugeordnete Beispiele ermittelt werden, die 
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als sog. klare Fälle in die Beschreibung der folgenden Subtypen des nachrichten- 
typischen Sprechstils eingingen (ebd., 339): INFO, JUGEND und PRIVAT. Als 
vierter Subtyp könnte SERVICE mit aufgenommen werden; er erweist sich in 
puncto Zuordnungshäufigkeit und -sicherheit jedoch nicht so deutlich wahrnehm- 
bar wie die drei anderen, sondern ist eher als besonders langsame Form des INFO- 


Stils beschreibbar. 


INFO 


seriös, moderat, präzise 


JUGEND 
jugendlich, melodisch, 
engagiert 


PRIVAT 
dynamisch, rasant, 
besonders 


moderates Sprechtempo, 
mittellange Gliederungsein- 
schnitte 


hohes Sprechtempo, wenig 
und kurze Pausen 


wenig Pausen, rasantes 
Tempo 


tiefe mittlere Sprechstimm- 
lage, wenig Tonhöhenbewe- 


gung 


„junge“ mitteltiefe bis hohe 
Stimme, bewegte Sprechme- 
lodie 


„auffällige“ oder besondere 
Stimme, dynamische und 
(sehr) melodische Sprech- 
weise 


(sehr) präzise, deutliche 
bzw. akkurate Artikulation; 
Sprechweise ruhig und be- 
dacht 


jugendliche Sprechweise, 
(teilweise) weniger präzise 
artikuliert 


erhöhte Sprechspannung, 
größere Lautheit, (teilweise) 
artikulatorische Besonder- 
heiten 


deutliche Gliederung durch 
eindeutige Akzente und häu- 
fige Gliederungseinschnitte, 
Tendenz zum Stakkato- 
Rhythmus 


weniger deutliche Gliede- 
rungspausen, melodisch- 
temporale Gliederungssig- 
nale, Endmelodie häufig 
progredient 


(starke und häufige) Druck- 
und Melodieakzente, melo- 
dische, teilweise progre- 
diente Satzabschlüsse 


Tab. 3: Minimalbeschreibung formatspezifischer Subtypen des nachrichtentypischen Sprech- 


stils 


Vor dem Hintergrund formatspezifischer Angemessenheitsvorstellungen können 
diese definierten und in ihren Merkmalen detailliert beschriebenen Subtypen des 
nachrichtentypischen Sprechstils (Tabelle 3) für weitere Untersuchungen als Ba- 
sis zur Untersuchung und zur Diskussion des advance organizer-Prinzips genutzt 
werden: Wirken Formatsprechstile nicht nur zur Wiedererkennung, sondern dient 
der gewohnte bzw. präferierte Formatstil auch zur besseren Rezeption von Nach- 
richteninhalten? 
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3 Ausprägungen eines formatspezifischen Sprachstils als ad- 
vance organizer 


Vorweg: An dieser Stelle wird noch keine empirische Untersuchung bzw. deren 
Ergebnis (wie im vorherigen Abschnitt) vorgestellt, sondern es werden zunächst 
anhand einer Beispielanalyse Überlegungen und Annahmen präsentiert, welche 
Faktoren einen sender- bzw. formatspezifischen Nachrichtensprachstil charakte- 
risieren könnten. 


Ausgangspunkt ist die recht banale Beobachtung, dass ein konkretes Thema einer 
Nachrichtenmeldung von verschiedenen Radiosendern sprachlich unterschiedlich 
aufbereitet und präsentiert wird. Als Beispiel soll die Meldung einer Nachrichten- 
sendung vom 11.09.2021 der Sender DLF und WDR 2 dienen: 


In Berlin haben tausende Menschen gegen zu hohe Mieten protestiert. Die 
Schätzungen zu den Teilnehmern schwanken zwischen 7000 und 20000. Zu der 
Demonstration hatten mehrere Bündnisse und Organisationen aufgerufen. Sie 
fordern von der Politik einen Kurswechsel in der Mieten- und Wohnungsbau- 
politik. Ein Sprecher des Berliner Bündnisses gegen Verdrängung und Mie- 
tenwahnsinn sagte in seiner Rede, bundesweit müssten alle Mietkonzerne 
enteignet werden, Wohnraum dürfe nicht an die Börse. Zuletzt hatte sich 
unter anderem die Spitzenkandidatin der SPD für das Amt der Regierenden 
Bürgermeisterin, Giffey, gegen solche Forderungen ausgesprochen. 


Bsp. 1: Meldung zum Thema „Demonstration gegen zu hohe Mieten“, DLF 11.09.2021, 18.00 
Uhr 


In Berlin sind rund 20000 Menschen auf die Straße gegangen. Sie haben für 
bezahlbare Mieten demonstriert. Gefordert wurde ein radikaler Kurswechsel 
in der Mieten- und Wohnungspolitik. Mieterinnen und Mieter müssten bun- 
desweit besser geschützt werden. 


Bsp. 2: Meldung zum Thema „Demonstration gegen zu hohe Mieten“, WDR 2 11.09.2021, 
18.00 Uhr 


Grundsätzlich unterscheiden sich die beiden Nachrichtensendungen darin, dass 
bei den Nachrichten des DLF die Standardform der Nachrichten verwendet wird 
(vgl. Burger / Luginbühl 2014, 256), bei der ein Sprecher allein die Nachrichten 
verliest und bis auf ein Eingangsjingle keine weiteren musikalische Elemente vor- 
kommen. Demgegenüber handelt es sich bei den Nachrichten von WDR 2 um sog. 
Originalton-Nachrichten (O-Ton-Nachrichten), in denen ein Wechsel zwischen 
Nachrichtensprecher*in und den O-Ton-Einspielern bzw. Korrespondentenbe- 
richten stattfindet (siehe auch Abschnitt 4). Zudem werden hier die Meldungen 
durch musikalische Jingles voneinander getrennt. 
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Um v. a. die sprachliche Ebene in den Blick zu nehmen, wurden für die fol- 
gende Analyse zwei Beispielmeldungen ausgewählt, die lediglich durch einen 
Sprecher verlesen wurden. Auffallend ist zunächst die unterschiedliche Informa- 
tionsauswahl innerhalb der Meldung und damit auch die unterschiedliche Länge 
der Meldungen. Etwas systematisierter können die folgenden Faktoren zur Ana- 
lyse eines formatspezifischen Sprachstils — bezogen auf die Ebene der einzelnen 
Nachrichtenmeldung - in den Blick genommen werden (vgl. ebd., 256 ff.): 


- Meldungsumfang (Anzahl und Länge der Wörter und Sätze) 
- Wortwahl — Lexik (Vokabular und Redundanz / Synonymie) 
-  Satzbau / Satzkomplexität — Syntax 
- Aufbau der Meldung — Struktur (Existiert ein Leadsatz? Wie ist er gestal- 
tet? Welches Strukturmuster ist innerhalb der Meldung erkennbar? Wie ge- 
schieht die Themenentwicklung bzw. die thematische Progression? Wie 
werden neue und bekannte Informationen und in welcher Reihenfolge prä- 


sentiert?) 

Kriterium Meldung DLF Meldung WDR 2 

Wortanzahl 86 34 

Satzanzahl 5 4 

Satzlänge durchschn. 17 Wörter je Satz durchschn. 8,5 Wörter je Satz 

Wortwahl Standard-Nachrichtenvokabular Standard-Nachrichten Vokabular, 
(„protestieren“), nicht gegendert leicht vereinfacht („auf die Straße 

gegangen“), gegendert 

Syntax / Satz- vorwiegend Hauptsätze; indirekte | einfache Hauptsätze 

komplexität Rede; regressive Konstruktion im 
letzten Satz 

Leadsatz 4 Informationseinheiten; “gegen zu | 3 Informationseinheiten; “für be- 
hohe Mieten” zahlbaren Wohnraum” 

Struktur der Leadsatz — Konkretisierung — Hin- | Leadsatz — Konkretisierung — Hin- 

Meldung tergrund — Reaktionen tergrund 

Themenentwick- | Thematische Progression fort- Thematische Progression fort- 

lung / neue vs. schreitend und aufeinander aufbau- | schreitend und aufeinander aufbau- 

bekannte Infor- | end; zahlreiche neue Informationen | end; vorwiegend nur eine neue In- 

mationen je Gliederungseinheit formation je Gliederungseinheit 


Tab 4: Übersicht über ausgewählte sprachliche Merkmale der Meldungen aus Beispiel 1 und 2 
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Die Nachrichtenmeldung des DLF ist ausführlicher und gibt mehr Informationen 
je Gliederungseinheit; aus diesem Grund kann die sprachliche Gestaltung als et- 
was komplexer als die der Meldung von WDR 2 angesehen werden. Zudem sind 
in der Unterscheidung der beiden Meldungen beim Leadsatz zwei Aspekte auf- 
fällig: In der Meldung des DLF wird das Wort „protestieren“ verwendet, während 
in der Meldung von WDR 2 viele Menschen „auf die Straße gegangen sind“, was 
als einfacheres sprachliches Vokabular anzusehen ist. Zudem wird in der Meldung 
des DLF „gegen zu hohe Mieten“ protestiert, während in der Meldung von 
WDR 2 „für bezahlbaren Wohnraum“ demonstriert wird. Hier könnte als sender- 
spezifische Variante bei WDR 2 das verständlichkeitsfördernde Prinzip des Ver- 
meidens von „doppelten Verneinungen“ (Wachtel 2009, 56) zur Anwendung ge- 
kommen sein und damit den Charakter eines service-orientierten Sendeformats 
unterstützen. 


Um einen sender- bzw. formatspezifischen Nachrichtensprachstil zu beschreiben, 
müsste nun untersucht werden, inwiefern sich die hier genannten Eigenschaften 
in einem größeren Korpus wiederfinden lassen. D. h. zum einen, welche sender- 
spezifischen Eigenschaften sich in der Gestaltung von Nachrichtenmeldungen 
festhalten lassen, und zum anderen, welche formatspezifischen Eigenschaften 
sich daraus musterhaft erkennen lassen. Dies könnte z. B. im Rahmen einer Ana- 
lyse des Korpus der Nachrichten-Arche geschehen (vgl. Schwiesau et al. 2011). 
In der Nachrichten-Arche werden die Nachrichtensendungen zahlreicher Radio- 
sender gesammelt und archiviert, die jeweils am 11. November eines Jahres um 
13.00 Uhr gesendet wurden. Dabei ist zu erwarten, dass (zumindest einige) The- 
men von mehreren Sendern aufgegriffen werden, sodass es möglich ist zu unter- 
suchen, inwieweit sich themengleiche Meldungen in ihrer sprachlichen Gestal- 
tung gleichen bzw. unterscheiden. D. h. es geht darum, wiederholt auftretende 
Muster (i. S. v. Eigenschaftskomplexen) zu ermitteln und ggf. Senderformaten 
zuzuordnen. Sind solche Eigenschaftsmuster erkennbar, ist zu vermuten, dass 
diese als advance organizer für die Hörer*innen eines spezifischen Senderformats 
dienen können. Ob das tatsächlich so ist, müsste dann eine Behaltens- bzw. Ver- 
ständlichkeitsuntersuchung (siehe Abschnitt 4) empirisch belegen. 

Wesentlich hierbei ist, dass — unter Verständlichkeitsaspekten bzw. wenn das 
Ziel die Optimierung der Verständlichkeit der Nachrichten ist — zunächst die for- 
mat- bzw. senderspezifischen Eigenschaften erfüllt oder hergestellt werden müs- 
sen, um die Wiedererkennbarkeit des Formats bzw. des Senders zu gewährleisten, 
bevor auf sprachlicher Ebene optimierende Vorschläge zur Verständlichkeit um- 
gesetzt werden können. D. h. die pauschale Forderung beispielsweise nach der 
Vereinfachung der Nachrichtensprache (vgl. z. B. Straßner 1995) läuft ins Leere, 
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wenn die Formatierung eines Senders, an die sich die Rezipient*innen gewöhnt 
haben, eine andere Form etabliert hat. Es können also Konflikte auftreten zwi- 
schen dem Ziel einer möglichst verständlichen Nachrichtensprache und dem Ziel 
der Wiedererkennbarkeit des Nachrichtenformats / der Nachrichtensprache, wo- 
bei — wenn die wiedererkennbare Nachrichtensprache als advance organizer funk- 
tioniert — das nicht unbedingt ein Konflikt sein muss, sondern als stufenweise Er- 
gänzung gesehen werden kann: Die Realisierung eines format- bzw. 
senderspezifischen Sprachstils stellt die Basis bzw. den Rahmen dar, worin ver- 
ständlichkeitsoptimierende Maßnahmen in Bezug auf die sprachliche Gestaltung 
der Nachrichten angesiedelt werden können. 


4 Untersuchungsausblick und Formulierung von Forschungs- 
fragen 


Neben den (ausführlich diskutierten) sprecherischen (siehe Abschnitt 2) und den 
(eher kursorisch angesprochenen) sprachlichen (siehe Abschnitt 3) Eigenschaften 
einer Nachrichtensendung gibt es natürlich noch weitere, die als Faktoren zur 
Wiedererkennung eines Senders bzw. eines Formats und damit als advance orga- 
nizer dienen können. Vermutlich stellt gerade die spezifische Verbindung von 
sprecherischen, sprachlichen und weiteren Merkmalen einen charakteristischen 
Merkmalskomplex für ein konkretes Nachrichtenformat dar. Dabei kann die 
Frage, welches Merkmal ausschlaggebend für die Formatzuordnung ist, u. U. nur 
im konkreten Fall und nicht verallgemeinernd beantwortet werden. Es lassen sich 
weitere Merkmale unterscheiden. 


- Inhaltliche Gestaltung und Sendungsaufbau: Nachrichten- und Themen- 
auswahl sind ausgerichtet an dem (vermuteten) Informationsbedürfnis der 
Zielgruppe bzw. der Rezipient*innen und den entsprechenden Nachrich- 
tenwerten (vgl. Schwiesau / Ohler 2016, 13 ff.). Untersucht werden könnte 
die Themenfolge innerhalb der Nachrichtensendung. Forschungsfrage 
könnte sein, welche Inhalte mit welcher Relevanz in welcher Reihenfolge 
angeordnet werden. 

- Präsentationsform: a) Standardform mit einem Sprechereiner Sprecherin, 
b) Originalton-Nachrichten mit Wechsel von Sprecher*in und Einspielern 
oder c) News-Form mit mehreren Sprecher*innen im Dialog und Einspie- 
lern. 
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In Bezug auf die akustische Gestaltung können die Ausprägungen von 
Jingles und Senderkennung sowie den (meist musikalischen) Trennern zwi- 
schen den Meldungen ggf. mit Hinweischarakter auf den Meldungstyp 
(Sport, Regionales o. ä.) in den Blick genommen werden. Zudem kann be- 
trachtet werden, ob die gesprochenen Nachrichten mit einem Musikbett un- 
terlegt sind oder nicht. 


Zum Abschluss werden hier Forschungsfragen bzw. Untersuchungsoptionen vor- 
gestellt, die sich aus den bisherigen Überlegungen ableiten lassen: 


Sendervergleich thematisch gleicher Meldungen aus einem Nachrichten- 
korpus authentischer Nachrichten (z. B. der Nachrichten-Arche) im Hin- 
blick auf verschiedene Merkmale: Welche Übereinstimmungen lassen sich 
zwischen thematisch gleichen Meldungen auf sprecherischer bzw. proso- 
discher Ebene finden und beschreiben (angelehnt an Abschnitt 2)? Welche 
Übereinstimmungen lassen sich zwischen thematisch gleichen Meldungen 
auf sprachlicher Ebene finden und beschreiben (angelehnt an Abschnitt 
3)? Welche Übereinstimmungen lassen sich zwischen Nachrichtensendun- 
gen, die zeitgleich auf verschiedenen Sendern gelaufen sind, in Bezug auf 
die Merkmale inhaltliche Gestaltung und Sendungsaufbau, Präsentations- 
form und akustische Gestaltung finden und beschreiben (siehe oben)? 
Behaltens- und Verständlichkeitstests: Leit- und Forschungsfrage sollte 
hier sein, ob Proband*innen, die mit einem Sender bzw. einem Nachrich- 
tenformat vertraut sind, besser in Behaltens- und Verständlichkeitstests ab- 
schneiden als Versuchspersonen, die den jeweiligen Sender bzw. das jewei- 
lige Format seltener hören und dementsprechend weniger vertraut damit 
sind. Bspw. kann hierfür die Analyse der sprecherisch-stimmlichen Gestal- 
tung vertieft werden. Insbesondere könnten in Anschlussuntersuchungen 
systematische Stimmanalysen in Form auditiver Beschreibungen mit Ab- 
gleich zu messbaren Parametern durchgeführt werden. U. a. ist bisher der 
Einfluss der mittleren Sprechstimmlage und des genutzten Tonhöhenum- 
fangs auf die Hörverständlichkeit nicht untersucht. Dieser dürfte jedoch 
durchaus vorhanden sein, wenn die Annahme einer hörerseitigen Gewöh- 
nung an Sprechtonhöhen und Tonhöhenumfänge mit entsprechenden Irri- 
tationen bei abweichenden Sprechmustern besteht (vgl. Schwenke 2020, 
352). 
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- Diesen Tests sollten Wiedererkennungstests vorausgehen: Können Pro- 
band*innen Nachrichtensendungen bzw. ausgewählte Ausschnitte spezifi- 
schen Sendern oder Sendeformaten zuordnen, wie begründen sie ihre Ent- 
scheidungen und welche Präferenzen spielen dabei die ausschlagende Rolle 
(vgl. dazu die Untersuchung von Schwenke 2020 und siehe Abschnitt 2)? 


Vor allem die Behaltens- und Verständlichkeitstests nehmen die potentielle Wir- 
kung von sender- bzw. formatspezifischen Merkmalen als advance organizer in den 
Blick. Erst mit solchen Tests lässt sich empirisch belegt nachweisen, dass die text- 
externen Faktoren, die sich in einer Senderspezifik niederschlagen, Einfluss auf die 
Verständlichkeit von Nachrichten haben können. Letztendlich muss also festgehal- 
ten werden, dass die alleinige Betrachtung von sprachlich-sprecherischen Gesichts- 
punkten für die Optimierung der Verständlichkeit von Nachrichten nicht ausreicht, 
sondern dass es notwendig ist, diese beiden Ebenen sowie zahlreiche weitere Fak- 
toren im Sinne ihrer sender- bzw. formatspezifischen Ausprägung zu berücksichti- 
gen, um verständliche und ansprechende Nachrichten mit Wiedererkennungswert 
für die jeweilige formatvertraute Zielgruppe über den Äther zu schicken. 
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Nachrichtensprechstile im russischen Radio 
des 20. Jahrhunderts 


Valentina Sergeeva, Woronesh / Ines Bose, Halle (Saale) 


Dieser Beitrag liefert einen schlaglichtartigen Überblick über die Entwicklung der 
Radionachrichten in Russland, wobei der Fokus auf dem Sprechstil der Nachrich- 
ten liegt. Quellen dafür sind Einzelfunde und Beschreibungen typischer Nachrich- 
tensprechmuster bestimmter Epochen, Anforderungskataloge ans Nachrichten- 
sprechen aus Sicht der Radioschaffenden und Charakteristika berühmter 
Radiosprecher*innen. Außerdem wurden Hinweise auf öffentlich zugängliche 
Audiobeispiele zu russischen Radionachrichten aufgenommen. 


1 Einleitung 


Zur Geschichte des Sprechstils russischer Radionachrichten gibt es kaum ein- 
schlägige Publikationen. Allerdings sind in Publikationen zur Radiogeschichte 
Russlands hin und wieder Bemerkungen zu finden, die man auf das Nachrichten- 
sprechen beziehen kann. Deswegen stützt sich der folgende Überblick auf Einzel- 
funde wie Beschreibungen typischer Nachrichtensprechmuster bestimmter Epo- 
chen, auf Anforderungskataloge ans Nachrichtensprechen aus Sicht der 
Radioschaffenden und auf Charakteristika berühmter Radiosprecher*innen. Ge- 
sichtet wurden: 


- Lehrbücher für das Studium der Journalistik (z. B. Serel’ 2000 und 2004) 

- Dissertationen zur Entwicklung des russischen Radios (z. B. Tihonova 2005) 

- Jubiläums-Festschriften bedeutender Sender und Programme (z. B. maäk 
und ünost”) mit Erfahrungsberichten führender Nachrichtenjournalist*in- 
nen (z. B. Bolgarev 2004, Ruvinskij 2004) 

- Radio-Internetportale (z. B. das Projekt audiopedia, vgl. AV 1) mit Beiträ- 
gen zur Radiogeschichte — sowohl wissenschaftliche (z. B. Bolgarev 1979) 
als auch populärwissenschaftliche (z. B. über die legendären Radiospre- 
cher*innen Ü. B. Levitan und O. S. Vysockaä) 

-  Stichwort-Artikel aus Enzyklopädien (z. B. zum Radio-Erfinder A. S. Popov) 

- mündliche Auskünfte aus der Journalistischen Fakultät der Staatlichen Uni- 
versität Woronesh 
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Wie in Deutschland wurden auch in Russland und in der Sowjetunion zu keiner 
Zeit Radionachrichten systematisch gesammelt. Vereinzelt bestehende Archive 
(vgl. die Sammlungen der Archive staroe radio und svidetel’, vgl. AV 1) wurden 
zuerst in den 1970er Jahren, dann noch einmal in den 1990er Jahren vernachläs- 
sigt oder sogar vernichtet (Bolgarev 1979; Serel’ 2004, Petrov 2012). Insofern 
lassen sich die Anmerkungen zum Radionachrichten-Sprechstil in der Fachlitera- 
tur zumeist nicht anhand von Audiobeispielen umfassend empirisch belegen. Hin- 
weise auf öffentlich zugängliche Audiobeispiele zu russischen Radionachrichten 
haben wir in den folgenden Text aufgenommen. 


2 Die Anfangsphase der Radioübertragung in Russland 
(1895 bis 1920) 


Der 07. Mai wird in Russland alljährlich als „Tag des Radios“ begangen. Das 
Datum geht auf eine Erfindung des Physikers Aleksandr Stepanovič Popov 
(1859-1905) zurück, der am 07. Mai 1895 (25.04. des Julianischen Kalenders) an 
der Sankt Petersburger Universität das weltweit erste Detektionsgerät für elektri- 
sche Schwingungen vorführte und damit als Erfinder des russischen Radios gilt. 
Popov forschte überwiegend geheim im Auftrag des Marine-Ministeriums, aber 
er hat 1896 im Journal der Russischen Gesellschaft für Physik und Chemie die 
Beschreibung eines Funkempfängers zur Übertragung von Informationen veröf- 
fentlicht (Popov 1896; Radionov 1975). Bis 1899 konnte Popov die Reichweite 
der Funksignale auf 50 Kilometer steigern (Popov 1896; Smith-Rose 2013). 


Während der Oktoberrevolution war den Bolschewiki die Bedeutung des neuen 
Mediums Radio durchaus bewusst. 1918 beschloss der Rat der Volkskommissare, 
alle Funk-Angelegenheiten zentral im „Rat für Radiotechnik“ (radiotehniceskij 
sovet) anzusiedeln und landesweit Funktelegrafenstationen im Abstand von 1000 
bis 1200 Kilometern zu bauen. Innerhalb von zwei Jahren entstanden 200 Funk- 
stationen (Bolgarev 1979). 


3 Das frühe russische Radio (1921 bis 1924) 


Radio im eigentlichen Sinn, als täglich verfügbares Hörfunk-Massenmedium, gab 
es ab dem 01. Mai 1921 in Kasan. Ingenieure der kriegstechnischen Radioinfor- 
matik hatten Verstärker konstruiert, mit denen Telefongespräche über einige ge- 
wisse Distanz übertragen werden konnten (Serel’ 2000 und 2004). Daraufhin wur- 
den auf zwei Kasaner Plätzen und später auch auf sechs Plätzen in Moskau 
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Schalltrichter installiert, aus denen vorgelesene Zeitungsartikel zu unterschiedli- 
chen Themen für ein Massenpublikum gesendet wurden. In Moskau war am 17. 
Juni 1921 um 21.00 Uhr die erste ustnaja gazeta ROSTA (,„Gesprochene Zeitung 
ROSTA“) zu hören, die seitdem täglich bei schönem Wetter zwischen 21.00 bis 
23.00 Uhr ausgestrahlt wurde. Sie war anfangs aufgebaut wie eine gedruckte Zei- 
tung und enthielt aktuelle Informationen aus Zeitungen und der Nachrichtenagen- 
tur ROSTA („Revolutionäre Nachrichtenagentur Sowjetrusslands“) sowie Feuil- 
letons und kleine Gedichte. Die Texte wurden zunächst von Mitarbeitern der 
zentralen Radiotelefonstation (radiotelefonnaja stanzia) vorgelesen, später von 
Moskauer Schauspielern. Außerdem wurden wissenschaftlich-künstlerische Vor- 
träge, Konzerte und Opernaufführungen live übertragen (ebd.). Aufnahmen aus 
dieser Zeit sind nicht erhalten, jedoch einige Sendemanuskripte (Tihonova 2005). 


Nachfolgerin der ustnaja gazeta ROSTA war ab dem 23. November 1924 die ra- 
diogazeta ROSTA („Radiozeitung ROSTA“). Sie wurde täglich über 45 Minuten 
gesendet. In den aktuellen Nachrichten standen Aktualität, Kürze und Pointierung 
der Informationen für ein Massenpublikum im Vordergrund (vgl. Tihonova 2019, 
97). Gesendet wurden aktuelle Informationen, vorgelesen von einem Schauspieler 
mit „schöner Stimme und einwandfreier Aussprache“ (Serel’ 2000 mit Verweis 
auf Erzählungen der Radioveteranin Natal’ä Tolstova). Die radiogazeta ROSTA 
war bis 1932 die verbreitetste Form von Radionachrichten in der Sowjetunion 
(Tihonova 2005, 21), aber es gab auch andere Nachrichtenprogramme, z. B. seit 
1924 poslednie izvestia („Neueste Nachrichten“). 1925 wurde die erste Nachrich- 
tenagentur gegründet, die TASS (telegrafnoe agentstvo sovetskogo soüza). 


Am 01. Oktober 1924 gründete sich in Moskau die Aktiengesellschaft radio dla 
vseh („Radio für alle“). In dieser Gesellschaft widmeten sich Radiopioniere zu- 
nächst vor allem der technischen Entwicklung und Installation eines Radionetzes, 
später auch der inhaltlich-formalen Gestaltung von Radioprogrammen. Im selben 
Jahr begannen in Moskau die lokalen Radiosender A. S. Popov (12.10.1924) und 
komintern (23.11.1924) mit täglichen Sendungen. Eine spätere Version von kom- 
intern, konstruiert von dem russischen Physiker Aleksandr L’vovič Minc, galt in 
den 1930er Jahren als Radiosender mit der größten Reichweite weltweit (Nosyrev 
2016). 


4 Das etablierte russische Radio (1925 bis 1940) 


Ab 1925 wurde die radiogazeta inhaltlich und stilistisch für unterschiedliche Ziel- 
publika ausdifferenziert, vorzugsweise für Hörer*innen aus dem Arbeiter- und 
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Bauernmilieu (Serel’ 2000). Grundlage dafür waren empirische Analysen zu 
Sprache und Sprechen im Radio (vgl. Bolgarev 1979) und Wirkungsuntersuchun- 
gen (vgl. Lovell 2015, 72 ff.). Diese Untersuchungen hatten gezeigt, dass die Ra- 
diosprache derjenigen der gedruckten Zeitung sehr ähnlich und damit wenig hör- 
verständlich war. Sie wurde deshalb als radiopecat’ („Zeitungssprache‘‘) 
bezeichnet (Serel’ 2000). Auch der Sprechstil der radiogazeta war kritisiert wor- 
den, z. B. von dem avantgardistischen Dichter Sergej Mihajlovič Tret’äkov: Die 
Sprecher würden sich entweder wie Prediger (psalomsiki) monoton durch die In- 
formationsflut murmeln oder sie würden das Publikum selbst bei einfachsten The- 
men wie gouvernantische Didaktiker (didaktiki) patronisieren und bevormunden 
(Tret’äkov 1932, 3; zit. nach Lovell 2015, 80). 


Über den Einsatz von Frauen als Nachrichtensprecherinnen gibt es widersprüch- 
liche Angaben: Nach A. Andrianov (o. J.) wurden in den 1920er und 1930er Jah- 
ren in der radiogazeta die Nachrichtenmeldungen von einem Sprecher und einer 
Sprecherin im Wechsel präsentiert. Dagegen berichtet A. Serel’ (2004), dass Frau- 
enstimmen abgelehnt wurden, da ihr Klang nicht zum Ernst der gesendeten Infor- 
mationen passen würde. Allerdings habe der Direktor der Sprechergruppe A. 
Turin dagegen argumentiert; gerade wegen ihrer größeren Emotionalität sollten 
Frauenstimmen im Radio vorkommen, denn das Radio sei ein Instrument der äs- 
thetischen Wirkung (ebd.). Turin habe auch dafür plädiert, die radiogazeta grund- 
sätzlich lebendiger zu gestalten, mit verschiedenen Stimmen, gesprächshaft unter 
Verwendung von Alltagssprache, mit Beteiligung von Hörer*innen, die in Inter- 
views und Reportagen authentisch aus dem gesellschaftlichen und beruflichen Le- 
ben berichten sollten (ebd.). Serel’ (ebd.) verweist auch auf die Radiotheoretiker 
K. Bylinskij und D. Rozental’, die ähnlich argumentierten: Das Radio verlange 
einen eigenen, mündlichen, hörverständlichen Stil, denn es wende sich nicht an 
Leser*innen, sondern an Zuhörer*innen aus breiten Bevölkerungsschichten un- 
terschiedlicher Bildungsgrade. 


Nachrichten wurden in der radiogazeta viermal am Tag gesendet: morgens Infor- 
mationen aus den Zeitungen, mittags Nachrichten des Tages, abends eine Radio- 
zeitung für Arbeiter, spätabends eine Tageschronik und Inhalte aus den Zeitungen 
des darauffolgenden Tages. Sonntags gab es darüber hinaus einen Kurzüberblick 
über politische Ereignisse der vergangenen Woche. Vorherrschend war nach 
Serel’ (2000). ein sachlich-distanzierter Sprechstil. Seit 1928 wurden aber auch 
Live-Reportagen gesendet, in denen die Journalist*innen emotional, mit dem 
Ausdruck starker innerer Beteiligung, das gesellschaftliche Leben möglichst kon- 
kret und detailliert schildern sollten (ebd.). 
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1928 wurde zentral beschlossen, das Radionetz weiter auszubauen, Radioemp- 
fangsgeräte für möglichst alle Bevölkerungsgruppen erschwinglich zu machen 
und Programme für unterschiedliche Zielgruppen einzurichten. 1928 gab es über 
die Sowjetrepubliken verteilt mehr als 60 Radiosender in mehreren Sprachen. 
1930 gab es mehr als 300 verschiedene Radiozeitungen für unterschiedliches Ziel- 
publikum in verschiedenen Sprachen (Lovell 2015, 73), wobei alle Sendungen 
einer strengen ideologischen Kontrolle des sowjetischen Staates unterlagen. Be- 
sonders betont und bedient wurde der Bildungsauftrag des Radios bis hin zu einer 
radiouniversitet („Radiouniversität‘) für Arbeiter und Bauern (Muhin 2016). 


5 Das russische Radio im Zweiten Weltkrieg (1941 bis 1945) 


Mit dem Überfall Deutschlands auf die Sowjetunion 1941 wurden viele Radiosta- 
tionen in den Osten des Landes verlegt. Der Anteil künstlerischer Programme 
wurde stark verringert. Als Hauptaufgabe des Radios wurden die Frontberichter- 
stattung und die Motivierung der Bevölkerung zur Unterstützung des „Großen 
Vaterländischen Krieges“ erachtet, hinzu kamen Propaganda-Sendungen für das 
Ausland (Serel’ 2000) Damit verbunden war eine starke Zensur, d. h. Nachrichten 
wurden vor allem aus der Perspektive der Staatspolitik und -propaganda verfasst, 
Wahrheitsgehalt und Zuverlässigkeit waren zweitrangig (ebd.). Am 24. Juni 1941 
wurde innerhalb der Nachrichtenagentur TASS ein zentrales Informationsbüro 
(sovetskoe informbüro) eingerichtet, das die neuesten Kriegsinformationen bün- 
delte und an die Radiosender verteilte. 


Die Radiogeräte (überwiegend Drahtfunkempfänger) befanden sich zu dieser Zeit 
eher selten in Privathaushalten, sondern waren nach wie vor auf großen Plätzen 
oder in öffentlichen Gebäuden fest installiert (u. a. Miller 2014, 40). Damit fand 
Radiohören vorrangig in einem Öffentlichen, medial hergestellten akustischen 
Raum statt: 


„Während des Zweiten Weltkriegs war das Radiohören in der Sowjetunion auf 
Grund der Beschaffenheit des Klangraums ein performativer Akt. Die Gemein- 
schaftlichkeit des Hörakts führte zur stetigen Reproduktion der sowjetischen Ge- 
sellschaft. Sowjetbürger waren Radiohörer.“ (Miller 2014, 41; ähnlich auch Lovell 
2015, 116). 
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Radionachrichten wurden gemeinschaftlich gehört und diskutiert. Es ist zu ver- 
muten, dass der Sprechstil im russischen Radio der Kriegszeit auf diese Hörsitu- 
ation ausgerichtet war. Verschiedene Autor*innen heben das besondere Pathos 
des gesprochenen Wortes hervor (z. B. Miller 2014; Lovell 2015), das nicht mit 
einer individuellen Ansprechhaltung (wie z. B. für das westliche Radio dieser Zeit 
typisch), sondern mit einer Ausrichtung auf eine Masse an Hörer*innen in großer 
räumlicher Distanz erzeugt wurde. 


Besonders berühmt in dieser Zeit waren zwei Medienstimmen: die von Olga Ser- 
geevna Vysockaä (1906-2000) und Ürij Borisovič Levitan (1914-1983). 
Vysockaä sprach u. a. die Direktübertragungen von Großveranstaltungen auf dem 
Roten Platz in Moskau und war beliebt wegen ihrer warmen, emotional berühren- 
den Stimme (Adrianov o. J.; vgl. auch AV 2). Levitan verkündete seit 1934 im 
sowjetischen Allunionsrundfunk hochrangige Mitteilungen der Partei- und Staats- 
führung und war unverkennbar durch seine markige Stimme (tiefer, voller, dunk- 
ler Bariton, „eisern-samtig‘“; Miller 2014, 43) und seine langsame, getragen-pa- 
thetische, fast gesungene Sprechweise, verbunden mit einer überaus exakten 
Artikulation (vgl. AV 4). Levitan verlas die Nachrichten nicht neutral, „sondern 
interpretierte sie mit seiner Sprechkunst für das Radiopublikum, indem er Sätzen 
seinen Rhythmus verlieh und Wörter auf seine eigene Art und Weise betonte.“ 
(Miller 2014, 44). Vysockaä und Levitan galten beide als „Stimmen des Großen 
Vaterländischen Krieges“, denn sie lasen während des Krieges die Nachrichten 
des zentralen Informationsbüros, beginnend mit der berühmt gewordenen Formel 
vnimanie: govorit Moskva! („Achtung: Hier spricht Moskau!“) (AV 3). Damit 
prägten sie den radiophonen Kriegsalltag der sowjetischen Bevölkerung nachhal- 
tig und genossen außerordentlich hohes Ansehen (Miller 2014, 12). 

Da insbesondere Levitan staatswichtige Mitteilungen im Radio verkündete, ge- 
wann seine Stimme eine außerordentliche Autorität. Die Hörer*innen verknüpf- 
ten sie mit inhaltlicher Relevanz und der unbedingten Aufforderung zum Zuhören 
(Miller 2014, 43 mit Verweis auf LäSenko 1974, 15). Levitan galt in dieser Zeit 
als „Stimme der Macht“ (Miller 2014, 42) bzw. als „Radiosprecher des Staates“ 
(Bolgarev 1979, 43). Dass Levitan eine Medienikone über die Sowjetunion hinaus 
war, zeigt der Bericht von E. Koslov, dem Direktor der Informationsabteilung des 
Fernsehsenders pervyj kanal in einem Filmbeitrag (AV 3). Hitler habe Levitan als 
„Reichsfeind Nummer 1“ (ebd.) bezeichnet, und Goebbels habe eine Kopfprämie 
von 250.000 Reichsmark für denjenigen ausgesetzt, der Levitan lebend nach Ber- 
lin brächte, damit der Sprecher mit seiner markigen Stimme nach dem deutschen 
„Endsieg“ die Siegesmeldung aus dem Führerhauptquartier verkünde. Nach der 
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Kapitulation Hitlerdeutschlands verkündete Levitan stattdessen in Moskau die 
Siegermeldung der Roten Armee am 09. Mai 1945 (AV 4). 


Nach dem Krieg und mit dem Wiederaufbau des Landes begann eine neue Radio- 
nachrichten-Ära, und Levitans pathetischer Sprechstil, der mit dem Krieg assozi- 
iert wurde, war nicht mehr gefragt (RIA Novosti 2008). Er wurde als Sprecher 
nur noch zur Verkündung besonderer Ereignisse eingesetzt (z. B. zur Meldung 
des ersten bemannten Raumflugs 1961, vgl. AV 2). Einige Audio-Aufnahmen von 
Levitans Radiostimme sind heute noch vorhanden, allerdings meist nicht im Ori- 
ginal. Levitan hat in den 1950er und 1960er Jahren wichtige historische Meldun- 
gen möglichst nah am ursprünglichen Sound noch einmal produziert (Miller 2014, 
47; vgl. AV 4). 


6 Das russische Radio zur Zeit des sozialistischen Aufbaus 
(1946 bis 1979) 


Nach dem zweiten Weltkrieg entstand in der Sowjetunion das weltweit größte 
Radionetz (Serel’ 2000). 1948 gab es drei Programme des zentralen Radiosenders 
vsesoüznoe radio („Allunionsradio“) für alle sowjetischen Zeitzonen (Lapin 
1975). Anfang der 1960er Jahre umfasste der Sender insgesamt ca. 350 regionale 
und lokale Sendestationen (Serel’ 2000 und 2004). Seit dem 01. Oktober 1960 
sendete das sowjetische Radio rund um die Uhr (insgesamt 77 Stunden und 15 
Minuten täglich; Bolgarev 1979, 189). Das Nachrichtenprogramm poslednie iz- 
vestia („Neueste Nachrichten‘) strahlte seit dem 01. Januar 1958 täglich 18 Sen- 
dungen mit insgesamt 120 bis 130 Meldungen aus (mit Themen aus den Rubriken 
Politik, Wirtschaft, Wissenswertes, technischer Fortschritt aus dem In- und Aus- 
land) (Serel’ 2004). Maßgabe für das Radio war, möglichst positive Nachrichten 
zu senden, um den sozialistischen Aufbau des Landes zu unterstützen (Bolgarev 
1979, 163). Es herrschte eine flächendeckende Zensur, die die inhaltliche und da- 
mit auch die formale Kreativität der Radiomacher*innen einschränkte. Live-Sen- 
dungen, die für das frühe Radio durchaus typisch gewesen waren, kamen nun na- 
hezu nicht mehr vor. Bereits Ende 1946 wurden 95% der Sendungen 
vorproduziert (Serel’ 2000 und Serel’ 2004 mit Verweis auf D. Polikarpov, den 
Vorsitzenden des Staatlichen Radiokomitees von 1946). 


Die Anmutung des sowjetischen Radios in den 1950er bis 1970er Jahren wird als 
starr und steril beschrieben (vgl. Bolgarev 1979; Šerel 2000). Das galt auch für 
den Sprechstil. Oberste Priorität hatte die sprecherische Perfektion mit gestochen 
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scharfer standardrussischer Artikulation, präziser Prosodie und distanziert-sachli- 
cher, sog. „neutraler“ Ansprechhaltung (Bolgarev 1979, 165). Die professionellen 
Sprecher*innen waren hoch angesehen (sog. „Radio-Elite“, Ruvinskij 2004), sie 
galten für die Gesellschaft als sprecherische Vorbilder. Erst nach einer umfang- 
reichen Ausbildung erhielten sie die Sprecherlaubnis für das Mikrofon und wur- 
den beständig von Philolog*innen der Universitäten beraten und trainiert (z.B. in 
Bezug auf aktuelle Veränderungen in der russischen Standardaussprache und - 
prosodie; vgl. ebd.). 

Es gab allerdings auch wenige andere Tendenzen, z. B. das Jugendprogramm 
ünost’ und das Informationsprogramm maäk. Es handelte sich um zwei innovative 
Programme, die aufgrund ihrer direkten Adressierung und Kurzweiligkeit beim 
jeweiligen Zielpublikum sehr beliebt waren. Erste Schritte zu einem speziellen 
Jugend-Unterhaltungsprogramm hatte es bereits 1957 während der „6. Weltfest- 
spiele der Jugend und Studenten“ in Moskau gegeben. 1962, gegen Ende der po- 
litischen Tauwetterperiode nach dem Tod Stalins ging das Programm ünost’ (,„Ju- 
gend“) mit einer täglichen Sendung von eineinhalb Stunden regulär auf Sendung. 
Es richtete sich an ein Zielpublikum im Alter von 14 bis 35 Jahren. Unost’ sollte 
der ideologischen Erziehung der Nachkriegsgeneration dienen. Die Redaktion 
wollte vor allem auf die unterschiedlichen ideologischen, emotionalen und kultu- 
rellen Bedürfnisse und Interessen der Nachkriegsgeneration eingehen, die sie als 
„energievoll, gut ausgebildet und zielstrebig‘“ wahrnahm (Muzyrä 1979, 184). Es 
wurden Sendungen mit Themen vor allem aus Kultur und Unterhaltung, aber auch 
aus Bildung und Politik konzipiert, die sich auf jeweils spezielle Weise an unter- 
schiedliche Gruppen jüngerer Hörer*innen richteten (Arbeiter-, Bauern- und Aka- 
demikerjugend). Täglich 17.10 Uhr wurden aktuelle Informationen aus Gesell- 
schaft und Politik gesendet. 


Die ünost’-Macher*innen orientierten sich thematisch und stilistisch an der Le- 
benswelt und den Vorlieben der Jugendlichen. Der frische, informelle Präsentati- 
onsstil des Programms, das ständig mit der drohenden Zensur kämpfte, bildete 
einen starken Kontrast zu den anderen sowjetischen Radioprogrammen dieser 
Zeit. Dazu gehörte auch, dass ünost’ als erstes sowjetisches Radioprogramm zu 
einem gewissen Anteil ausländische (z. B. europäische und amerikanische) Musik 
spielte. Besonderes Kennzeichen war der enge Hörerkontakt, z. B. über vorgele- 
sene Hörerbriefe (polevad počta ünosti), in denen das junge Publikum Sendungen 
kommentieren und selbst Themenvorschläge machen konnte, auf die die Redak- 
tion möglichst einging. Innerhalb kurzer Zeit war das Programm sehr populär und 
blieb es bis zum Ende der Sowjetunion. In den 1990er Jahren wurde es in einen 
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Privatsender umgewandelt und hielt sich bis 2010. Seit 2018 gibt es ünost’ wieder, 
als Internetradio (VGTRK 2018). 

Das Informationsprogramm maak („Leuchtturm“) wurde am 01. August 1964 
eingerichtet und sollte auf das gestiegene Bedürfnis der Bevölkerung nach schnell 
verfügbaren Informationen und moderner Unterhaltung reagieren. Dieses Pro- 
gramm war ein Gegenentwurf zu westlichen Unterhaltungssendern und suchte 
dem Lebensgefühl breiter Bevölkerungsschichten der 1960er Jahre zu entspre- 
chen. In raschem Wechsel wurden Musik und Informationen munter-launig von 
mehreren Studiosprecher*innen präsentiert. Zum kurzweiligen Charakter gehörte 
nach Serel’ (2000) auch der lakonische Stil, also ein ökonomischer Gebrauch 
sprecherischer Mittel. Mindestens zweimal pro Stunde wurden ausführliche 
Nachrichten gesendet, dazwischen Kommentare, Kurzreportagen und Interviews 
zu tagesaktuellen Themen, zu einem gewissen Anteil aber auch Musik und künst- 
lerische Sendungen. 


Wie aus einigen frei verfügbaren Audiobeispielen von ünost’ und maâk hervor- 
geht (AV 1 und 5), sind die Nachrichten durchaus hörernäher und eingänglicher 
formuliert, näher an der Alltagssprache als in anderen Programmen. Das zeigt sich 
auch in der direkten Höreransprache, wie z. B. kak vy znaete, dorogie tovarisi 
(„Wie Sie ja wissen, liebe Hörer“). Dem Höreindruck nach (AV 1 und 5) scheinen 
sich die Nachrichten von ünost’ und maak im Sprechstil allerdings nicht von de- 
nen der anderen Programme unterschieden zu haben (ebd.). 

Seit den 1970er Jahren verdrängte das Fernsehen das Radio als Hauptmedium. 
Das sowjetische Radio reagierte jedoch nicht darauf und die Zeit vom Ende der 
1960er bis zur ersten Hälfte der 1980er Jahre gilt allgemein als Erstarrungsphase 
des sowjetischen Radios. Es war die Ära der Fünfjahrespläne und auch die Radi- 
oprogramme wurden langfristig komplett durchgeplant und ideologisch über- 
frachtet. Die Radioverantwortlichen setzten auf altbewährte Sendungen bzw. 
Rubriken, thematische oder ästhetische Neuerungen wurden dagegen vermieden 
(Serel’ 2000 und 2004). Im Zentrum aller Programme (auch z. B. der Kinder- und 
Musikprogramme) standen politische Inhalte, zum Beispiel Berichte über politi- 
sche Festtage. Ungeachtet zunehmender alltäglicher Spannungen und gesell- 
schaftlicher Probleme blieb es die Aufgabe des Radios, ein durchweg positives 
Gesellschaftsbild zu zeichnen (Serel’ 2000). Verbunden mit dieser starren Hal- 
tung und der Vorproduzierung der Beiträge war überwiegend ein vorhersehbarer, 
stereotyp-optimistischer, steriler Sprach- und Sprechstil von prinzipiell aus- 
tauschbaren Sprecher*innen, was die Attraktivität und Glaubwürdigkeit des Ra- 
dios beeinträchtigte (ebd.). Allerdings berichtet Alexandr Il'ič Ruvinskij, ein ehe- 
maliger Redakteur von maäk, dass es in den Nachrichtensendungen von maak und 
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poslednie izvestiä bereits Ende der 1970er Jahre erste Experimente mit kurzen 
Live-Kommentaren gegeben habe (vgl. Ruvinskij 2004). Die Journalist*innen 
hätten darin zusätzliche Informationen zur TASS-Agenturmeldung gebracht und 
um eigene Eindrücke und Bewertungen, Schilderungen von emotionalen Details 
und Atmosphäre ergänzt (ebd.). 


7 Das russische Radio der Perestroika (1980 bis 1990) 


Ab Mitte der 1980er Jahre erlebte die sowjetische Gesellschaft eine Phase der 
gesellschaftlichen Veränderung: perestrojka und glasnost’ („Umbau“ und 
„Iransparenz“) und damit den allmählichen Abbau der Zensur. Hatte die Nomen- 
klatura in den 1980er Jahren generell noch einen großen gesellschaftlichen Ein- 
fluss gehabt, wurden in den 1990er Jahren die gesetzlichen Grundlagen so verän- 
dert, dass sie eine Demokratisierung der Medien einleiteten (Serel’ 2000). Im 
schwerfälligen sowjetischen Radiosystem waren notwendige Veränderungen re- 
lativ schwer durchsetzbar und viele Radioprogramme arbeiteten zunächst weiter 
wie bisher. Dennoch versuchten einige Radiomacher*innen, von den bisher gel- 
tenden ideologischen und sprachlich-sprecherischen Stereotypen der konsequent 
positiven Gesellschaftsschilderung wegzukommen und neue radiophone Formen 
zu entdecken und zu etablieren. Sie suchten nach Formen, die es den Hörer*innen 
ermöglichen sollten, aktiv an den politischen und sozialen Veränderungen im 
Land teilzunehmen (z. B. über Live-Reportagen und echte Hörerdialoge; vgl. 
ebd.). 


In dieser Zeit entstanden erste formatierte Radioprogramme, z. B. Informations- 
Musik-Formate und Literaturformate (vgl. ebd.). Außerdem setzte eine generelle 
Individualisierung des Nachrichtenradios ein, indem nun Präsentator*innen zeit- 
kritische Inhalte vermittelten und sie selbst verantworteten. Die ersten erfolgrei- 
chen Anchors waren nicht diejenigen mit der professionellsten Sprechweise, son- 
dern diejenigen mit der größten journalistischen Kompetenz (Bolgarev 1979, 
Ruvinskij 2004). Bahnbrechend waren wiederum die Redaktionen von ünost’ und 
maäk. Unost’ sendete Januar 1987 die erste Live-Morningshow (ympennaa nepe- 
Oaua) mit Direktübertragungen von aktuellen Ereignissen sowie Live-Gesprächen 
im Studio und mit Hörer*innen. Damit stellten sich neue journalistische, sprach- 
liche und sprecherische Anforderungen, z. B. Auswahl und kritische Aufbereitung 
aktueller Themen, formulatorische Verständlichkeit und Klarheit, Improvisati- 
onsfähigkeit und Flexibilität. Die Trennung von Redakteur*innen und Spre- 
cher*innen wurde aufgehoben, am Mikrofon agierten nun Sprecherredakteur*in- 
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nen. Anatolij Pavlovič Bolgarev, von 1986 bis 1989 Programmchef von maäk, 
beschreibt die Veränderung seines Programms vom total vorgeplanten Radio hin 
zum eher improvisatorischen Live-Radio mit einer informell-lässigen Sprache 
und Sprechweise (Bolgarev 2004). 

Aus den Experimenten des Informationsprogramms maäk der 1970er Jahre 
(siehe Kapitel 1.5) wurden in den 1980er Jahren reguläre drei- bis vierstündige 
Live-Sendungen zu aktuellen Themen, präsentiert von einem oder zwei Redak- 
teur*innen am Mikrofon (Bolgarev 2004). Am 02. März 1987 strahlte maak seine 
erste reguläre Morgensendung namens informacionno-muzykal’naa panorama 
maäka ot 6 do 10 („maaks Informations-Musik-Panorama von 6 bis 10°) aus. Vier 
Stunden lang wurden in dichter Folge aktuelle Informationen aus der vergangenen 
Nacht und dem frühen Morgen gesendet, ergänzt durch Wettervorhersagen und 
Verkehrsmeldungen. In bestimmten Abständen wurden die Beiträge flexibel wie- 
derholt. Diese Live-Sendungen hatten meist ein Thema im Fokus, angestrebt 
wurde ein informeller, (quasi-)spontaner Präsentationsstil mit direkter Hörer- 
Adressierung und Inszenierung des Hier und Jetzt (Ruvinskij 2004; vgl. auch die 
sog. Liveliness, vgl. Tolson 2006). Ruvinskij (2004) berichtet von der Begeiste- 
rung, aber auch vom Stress der Anfangszeit des Panoramas. Er verweist z. B. auf 
die technischen Herausforderungen und die atemberaubende Geschwindigkeit, in 
der aktuelle Ereignisse für die Sendung aufbereitet wurden („Redaktionsschluss 
kurz vor Mitternacht, ab 4 Uhr ins Studio, anderthalb Stunden für die Durchsicht 
der letzten Nachrichten, 6 Uhr Sendung“; ebd.). Die starke Belastung habe mit- 
unter zu technischen Pannen geführt, die aber die Anmutung von Glaubwürdig- 
keit, Echtheit und Liveliness nicht gestört, sondern eher unterstützt hätten (Bol- 
garev 2004). Laut Ruvinskij wirkten diese Sendungen wesentlich glaubwürdiger 
als die komplett vorgeplanten Sendungen der 1970er Jahre (Ruvinskij 2004, Kap. 
6). Besonders wichtig waren den Verantwortlichen die individuelle Höreranspra- 
che, die im Kontrast zur bisher praktizierten unspezifischen Massen-Adressierung 
stand, sowie die Einbeziehung der Hörer*innen, die sich erstmalig über Telefon 
live in der Sendung äußern konnten (ebd.). Die bisherige eher „steril-neutrale“ 
Sprechweise am Mikrofon (vgl. ebd.) habe zunehmend überholt gewirkt. Viele 
professionelle Radiosprecher*innen der aktuellen Sendungen seien abgelöst wor- 
den und hätten nur noch in künstlerischen, vorproduzierten Sendungen (z. B. bei 
der Rezitation künstlerischer Texte) gearbeitet oder seien in die radiojournalisti- 
sche Aus- und Fortbildung gewechselt (ebd.). 


Diese sprecherischen Entwicklungen, die in den späten 1980er Jahren begonnen 
hatten und sich später auch in anderen Sendern etablierten, resümieren sowohl 
Ruvinskij (2004) als auch Bolgarev (2004) aber durchaus auch kritisch: Mit dem 
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Wegfall der Zensur sei leider auch das redaktionelle Handwerk vernachlässigt 
worden. Außerdem hätten sich in vielen Sendern statt der alten Sprechschablonen 
nun neue Manierismen etabliert, z. B. eine undifferenzierte, selbstsichere, bewer- 
tende und überaus schnelle Sprechweise. Im Vergleich zu früher seien die Präsen- 
tator*innen oft ins andere Extrem verfallen und hätten aufgrund mitunter fehlen- 
der sprecherischer Ausbildung pseudo-professionelle akustische Masken 
übernommen (Bolgarev 2004, Kap. 6). Bolgarev spricht von „schlechtem Theater 
vor dem Mikrofon“ (ebd.). Stattdessen fordert er radiofonicnost' („Radiopho- 
nie“), worunter er eine klassisch ausgewogene, professionelle Sprechweise ver- 
steht, die die Informationsvermittlung in den Vordergrund stellt und nicht davon 
ablenkt (ebd.). 


8 Das russische Radio unter Marktbedingungen (seit 1990) 


In den 1990er Jahren, spätestens seit dem Ende der Sowjetunion, vollzog sich eine 
starke Veränderung der massenmedialen Strukturen und damit verbunden eine 
Ausdifferenzierung der russischen Radiolandschaft in viele konkurrierende Sen- 
der bzw. Programme. Bereits 1990 entstanden die ersten Privatsender. Dazu ge- 
hören z. B. das oppositionelle Autorenprogramm eho moskvy („Moskauer Echo“) 
und der kommerzielle russisch-französische Musiksender evropa plus („Europa 
Plus“) (Serel’ 2004), ein gemeinsames Projekt von ünost’ und Kiss FM. Hier 
wurde erstmalig in der Sowjetunion regelmäßig ausländische Popmusik gespielt; 
Nachrichten wurden lediglich alle zwei Stunden gesendet. Der hohe Popmusik- 
Anteil und der besonders lässige Moderationsstil machten den Sender bei einem 
jungen Publikum rasch sehr beliebt — zwischen 2016 und 2019 war er der popu- 
lärste Sender in Russland (vgl. Mediascope). Inzwischen überwiegen in Russland 
private Radiosender, die auf Werbeeinnahmen angewiesen sind und auch ihre 
Nachrichten inhaltlich und formal auf die adressierten Werbekunden ausrichten. 
Es gibt nur noch einen kleinen Anteil staatlicher Sender. Darunter ist der klassi- 
sche Informationssender radio rossii („Radio Russlands“), der Journalist*innen 
von maäk und ünost’ sowie vom Allunionsradio übernommen hat und nach wie 
vor sehr bekannt und insbesondere bei einem älteren Publikum beliebt ist. Die 
Sendungen von radio rossii waren zu Beginn, Anfang der 1990er Jahre, regie- 
rungskritisch ausgerichtet und formal sehr kreativ. Seit 1995 wurde der Sender 
jedoch zunehmend regierungsnah und ist zurzeit durch einen eher konservativen 
Sprach- und Sprechstil gekennzeichnet (vgl. Serel’ 2004). 
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Nach einer Statistik des privaten Medienforschungsinstituts Mediascope für die 
Zeit von 2016-2019 (vgl. Mediasope) hören 89% der Bevölkerung Russlands (Al- 
ter über 12 Jahre) hauptsächlich in der Zeit von 07.00 bis 18.00 Uhr Radio. Damit 
spielt das Radio in Russland nach wie vor im massenmedialen Informationsange- 
bot eine Schlüsselrolle. Allerdings hören 47% der befragten Hörer*innen vor al- 
lem musikalische Programme, nur 11% hören regelmäßig politisch-informative 
Programme. Aufgrund der zunehmenden Ausdifferenzierung des russischen Ra- 
dios erscheint ein umfassender Überblick über aktuelle Tendenzen im Nachrich- 
tensprechstil kaum mehr möglich. Abgesehen von populärwissenschaftlichen 
Sprechstandards finden sich dazu nahezu keine wissenschaftlich basierten Unter- 
suchungen auf breiter Datenbasis. Diese Forschungslücke versucht eine empiri- 
sche Untersuchung zu aktuellen Tendenzen im Sprechstil russischer Radionach- 
richten zu schließen (Sergeeva i. V.). Ein Bericht dazu findet sich im zweiten Teil 
des Beitrags in diesem Band (Sergeeva in diesem Band). 
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Sprechstil und Formatbezug 
in aktuellen russischen Radionachrichten 


Valentina Sergeeva, Woronesh 


In diesem Beitrag wird, anknüpfend an Sergeeva / Bose (in diesem Band), eine 
laufende empirische Untersuchung zu Nachrichten-Sprechstilen im aktuellen rus- 
sischen Radio und zu ihrer Hörerwirkung vorgestellt (Sergeeva i. V.). Sie umfasst 
sowohl auditiv-akustische Nachrichten-Untersuchungen als auch Hörexperimente 
mit russischen und deutschen Radiohörer*innen zur Formatidentifikation russi- 
scher Nachrichten. Damit knüpft sie an eine Untersuchung von Schwenke (2020) 
zum Sprechstil und Formatbezug deutscher Radionachrichten an; Ziel ist u. a. ein 
kontrastiver Vergleich. Da die Sprechstil-Untersuchungen erst angelaufen sind, 
können endgültige Ergebnisse noch nicht vorgelegt werden. Deshalb wird im Fol- 
genden das Untersuchungsdesign vorgestellt und es wird über die Hörexperi- 
mente zur Formatidentifikation berichtet. 


1 Untersuchungskorpus 


Das Untersuchungskorpus besteht aus Live-Mitschnitten aktueller russischer Ra- 
dionachrichten aus dem Zeitraum August bis Dezember 2017. Es sollten mög- 
lichst Sender unterschiedlicher Formate berücksichtigt werden. Unter Format 
wird in der deutschen und angelsächsischen Literatur die „zielgruppenorientierte 
Programmgestaltung unter Einbezug aller auditiv zur Verfügung stehenden Mit- 
tel“ verstanden, wobei mindestens drei Kategorien zu berücksichtigen sind: Or- 
ganisationsform (Privatsender oder öffentlich-rechtlicher Sender), Programm 
(Info/Kultur, Unterhaltung u a.) und Zielgruppe (Jugendsender, Sender für Se- 
nior*innen u.a.) (Schwenke 2020, 112-117 und 285). Diese Einteilung gilt 
durchaus auch für die aktuelle russische Radiolandschaft, wie sich an der Selbst- 
positionierung von Sendern in ihren Internetauftritten ablesen lässt (siehe Quel- 
lenverzeichnis). 
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Über jeweils eine Woche wurden Sendungen zur russischen Prime Time aufge- 
nommen, also von 9.00 bis 11.00 und 17.00 bis 19.00 Uhr, Das Gesamtkorpus 
umfasst 58 Sendungen (1 bis 9 min Dauer, insges. 216 min) von 38 Sendern, da- 
runter 28 überregionale und 31 private Sender. 19 Sender sind dem Format „Adult 
Contemporary“ zuzuordnen, 11 dem Format „News Talk“ und 5 dem Format 
„Contemporary Hit Radio“ (gemäß den Senderselbstauskünften im Internet). Das 
Geschlechterverhältnis ist ausgeglichen; 50 Prozent der erhobenen Sendungen 
werden von Frauen, die anderen 50 Prozent von Männern präsentiert. In zwei 
Sendungen wechseln die Stimmen in Abhängigkeit von der Rubrik (Sport und 
Wetterbericht werden von einem Sprecher gesprochen, die eigentlichen Nachrich- 
tenmeldungen von einer Sprecherin). 51 Sendungen sind mit Musik unterlegt. Für 
die Analyse wurden 35 Nachrichtensendungen (insges. 137 min) mit einem brei- 
ten Spektrum hinsichtlich Aufbau, Struktur, Präsentation (Sprach- und Sprechstil, 
Hintergrundmusik) sowie Dauer ausgewählt. 


2 Nachrichtensufbau und Nachrichtensprechstil 


Die Audioaufnahmen dieser 35 Nachrichtensendungen werden zurzeit verschrif- 
tet und mittels des Soundanalyseprogramms Praat (Boersma / Weenink 2017) 
annotiert (Aufbau und Struktur der Nachrichten) sowie auditiv und akustisch pho- 
netisch analysiert (Sprechgeschwindigkeit, Pausierung, Akzentuierung, Sprech- 
tonhöhe). 

Bei der bisherigen Sichtung des Auswahlkorpus zeigt sich, dass russische Ra- 
dionachrichten üblicherweise folgenden Aufbau haben: 


- Überleitung und (Selbst-)Vorstellung des Sprechers bzw. der Sprecherin 
(55 von 58 Sendungen) 

- Themenüberblick (18 Sendungen) 

- Spannweite von 1 bis 6 Nachrichtenmeldungen, zumeist 5 Meldungen 
(43 Sendungen) 

- Wettervorhersage (32 Sendungen) 

-  Verkehrsmeldung (6 Sendungen) 

- Wechselkurs (13 Sendungen) 

- Abschluss und Verabschiedung des Sprechers bzw. der Sprecherin (46 Sen- 
dungen) 


Zum Sprechstil können noch keine Ergebnisse präsentiert werden, da die Unter- 
suchungen noch nicht abgeschlossen sind. Allerdings zeigt sich bereits, dass die 
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russischen Radionachrichten ebenso wie die deutschen (Schwenke 2020) durch 
eine sehr hohe Akzentdichte und ein hohes Sprechtempo gekennzeichnet sind. Im 
Vergleich zu den deutschen Nachrichten scheinen sie noch schneller gesprochen 
zu werden und weniger Pausen zu enthalten. 

Wie oben erwähnt, sind 51 von 58 Nachrichtensendungen des Korpus mit Mu- 
sik unterlegt. Die Hintergrundmusik entspricht dem Senderformat: In einigen 
Sendungen klingt sie eher zurückhaltend (Informationssender für älteres Publi- 
kum), in anderen dagegen sehr vordergründig (energetisch, rhythmisch, laut), so 
dass vermutlich die Verständlichkeit der Nachrichteninformation beeinträchtigt 
wird (z. B. bei Unterhaltungssendern für jüngeres Publikum). Offensichtlich wird 
in diesen Formaten stärkerer Wert auf eine stimmungsvolle Gesamtanmutung als 
auf die zu vermittelnden Inhalte gelegt, so wie es Bose und Finke (2016) für deut- 
sche Radio-Morningshows beobachtet haben. 


3 Hörexperiment zur Formatidentifikation 


Schwenke (2020, 280-298) konnte in einem Hörexperiment zeigen, dass deutsche 
Radiohörer*innen anhand des Sprechstils verschiedene Formate identifizieren 
können: öffentlich-rechtlich vs. privat, Info/Kultur vs. Unterhaltung, Jugendsen- 
der vs. Sonstige (Material: deutschsprachige Testnachrichtenmeldung in verschie- 
denen quasi-authentischen Sprechfassungen). In Anlehnung an diese Untersu- 
chung wurden auch für acht russische Radionachrichten-Meldungen solche 
Hörexperimente durchgeführt. Befragt wurden 50 Hörer*innen mit deutscher 
Muttersprache ohne Russischkenntnisse und 50 Hörer*innen mit russischer Mut- 
tersprache im Alter zwischen 18 und 30 Jahren. Die meisten Proband*innen wa- 
ren Studierende der Martin-Luther-Universität bzw. der Staatlichen Universität 
Woronesh. Mittels eines Fragebogens wurde geprüft, ob sie unabhängig vom 
Sprachverständnis in den russischen Nachrichtenbeispielen einen typischen 
Nachrichtenklang identifizieren und diesen möglicherweise sogar Programm- 
bzw. Senderformatvorgaben zuordnen können, die der Sender-Selbstpositionie- 
rung entsprechen. 


3.1 Fragebogen 


Der Fragebogen ist an Schwenke (2020, 233) orientiert und wurde für das aktuelle 
Hörexperiment angepasst (Abbildung 1). In einer Tabelle sollten die Proband*in- 
nen die Hörbeispiele einem vorgegebenen Format zuordnen, ihre Zuordnung 
möglichst begründen und angeben, wie leicht bzw. schwer ihnen diese Aufgabe 
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gefallen war und woran sie sich vorrangig orientiert hatten (Sprechweise vs. Hin- 
tergrundmusik). Darüber hinaus wurden einige Sozialdaten der Proband*innen 
und Angaben zu ihren Radio-Nutzungsgewohnheiten erhoben. Wie im Hörexpe- 
riment von Schwenke (2020, 280-298) wurden auch hier Formatvorgaben ge- 
macht: zum Programm (Information / Unterhaltung) und zur Zielgruppe (junges 
Publikum / mittleres Erwachsenenalter / älteres Publikum) (siehe Abbildung 1). 
Die deutschen Proband*innen wurden außerdem gefragt, ob die Hörbeispiele wie 
Nachrichten klingen oder nicht. 


Können Sie das Beispiel zuordnen? Gründe (z.B. schnell/langsam, viele/wenige Pausen, formell/informell, 
Mehrere Antworten möglich. melodisch/monoton, gespannt/entspannt, Gesamtwirkung ...): 
UO nein 


Klingt der vorgespielte Ausschnitt wie 
Nachrichten? 
O ja[ eherja eher nicht [] nein 


[U Informationssender 
[] Unterhaltungssender 
O Sonstiges: 


Sender für junges Publikum 
E Sender für mittleres Erwachsenenalter 
O Sender für älteres Publikum 


Die Zuordnung war ... E leicht E mittel E schwierig 


Bei der Zuordnung habe ich mich orientiert 
an: 


Musik I Sprechweise 


Abb. 1: Fragebogen zum Hörexperiment (für deutsche Hörer*innen, Ausschnitt) 


3.2 Hörbeispiele 


Als Stimuli dienten acht Nachrichtenmeldungen (M1 bis M8: 14 bis 35 sec Dauer) 
ohne Verpackungselemente oder Senderkennung aus acht verschiedenen Sendern 
(siehe Tabelle 1). Die Auswahl der Beispielmeldungen sollte ein möglichst breites 
Spektrum umfassen (hinsichtlich der Organisationsform, des Programms und der 
Zielgruppe sowie des Vorhandenseins von Hintergrundmusik). 

Die Audios zu den im Beitrag behandelten Beispielen (Transkripten) sind ver- 
fügbar über den QR-Code zu Beginn des Artikels bzw. unter: 

https://cloud.uni-halle.de/s/Y3jDFkDE8cyh3LQ. 
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Meldung Radio- Organisa- Programm Zielgruppe Hinter- 
sender tionsform grund- 
musik 
M1 Kommersant | privat Information | 30-50 Jahre, mittellaut 
(Audio 1) | FM mittleres Er- 
wachsenenalter 
M2 Lipetsk FM öffentlich- | Information | 35+, mittellaut 
(Audio 2) rechtlich mittleres Er- 
wachsenenalter 
M3 Love Radio privat Unterhaltung | 16-35 Jahre, laut 
(Audio 3) junges Publikum 
M4 Radio Sem privat Unterhaltung | 30-50 Jahre, leise 
(Audio 4) mittleres Er- 
wachsenenalter 
M5 Radio Rossii | öffentlich- | Information 40+, keine 
(Audio 5) rechtlich älteres Publikum 
M6 Radiola privat Unterhaltung | 35-59, weiblich, | mittellaut 
(Audio 6) mittleres Er- 
wachsenenalter 
M7 Svoboda privat Information | 20-40 Jahre, keine 
(Audio 7) mittleres Er- 
wachsenenalter 
M8 Zvezda öffentlich- | Unterhaltung | 20-55 Jahre, laut 
(Audio 8) rechtlich mittleres Er- 
wachsenenalter 


Tab. 1: Hörbeispiele des Hörexperiments 


Jedes Hörbeispiel wurde einmal präsentiert, dann hatten die Proband*innen eine 
Minute Zeit, den Fragebogen auszufüllen. Sie wurden gebeten, die Formatzuord- 
nung anhand des Sprechstils zu treffen und die Hintergrundmusik möglichst aus- 
zublenden. Vor dem Experiment erhielten die Proband*innen eine Instruktion zu 
Zweck und Ablauf des Experiments — sie wussten also, dass ihnen eine Reihe von 
Nachrichtenmeldungen vorgespielt werde. Außerdem erhielten die Proband*in- 
nen einen Auszug aus der Testtabelle zum Einschätzen eines Probebeispiels. Nach 
der Beurteilung des Probebeispiels wurde der Fragebogen zu den acht Hörbei- 
spielen ausgeteilt. Insgesamt dauerte das Hörexperiment etwa 30 Minuten. 
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3.3 


Ergebnisse 


3.3.1 Formatidentifikation (Programm und Zielgruppe) durch die 


Hörer*innen 


Die Abbildungen 2 und 3 zeigen zunächst die prozentuale Verteilung der Anga- 
ben zur Formatidentifikation (Programm und Zielgruppe), unterschieden in Über- 
einstimmung und Nichtübereinstimmung der Hörer*innen-Urteile mit der Sen- 
der-Selbstpositionierung. Im Anschluss werden alle acht Hörbeispiele (MI bis 
M8) anhand der Hörer*innen-Angaben beschrieben. 


100% 
90% 
80% 
70% 
60% 
50% 
40% 
30% 
20% 
10% 

0% 


EEEE DEE 
E Keine Angabe 
E Sonstiges 
Nichtübereinstimmung 
| All m Übereinstimmung 


M1 M1 M2 M2 M3 M3 M4 M4 M5 M5 M6 M6 M7 M7 M8 M8 
De Ru De Ru De Ru De Ru De Ru De Ru De Ru De Ru 


Abb. 2: Programm-Identifikation (je 50 deutsche und russische Hörer*innen) 
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| f | | | | | E Keine Angabe 
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| | | | | f | | | | m Übereinstimmung 


M1 M1 M2 M2 M3 M3 M4 M4 M5 M5 M6 M6 M7 M7 M8 M8 
De Ru De Ru De Ru De Ru De Ru De Ru De Ru De Ru 


Abb. 3: Zielgruppen-Identifikation (je 50 deutsche und russische Hörer*innen) 
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Meldung M1 (Audio 1): Kommersant FM — Informationsprogramm für mittleres 
Erwachsenenalter mit mittellauter Hintergrundmusik 

Dieses Beispiel wurde von der Mehrheit (mehr als 60%) sowohl der deutschen als 
auch der russischen Hörer*innen dem Informationsformat zugeordnet, was auch 
der Selbstpositionierung des Senders entspricht. Auch das Alter des Zielpubli- 
kums wurde von 94% der russischen Hörer*innen und von 62% der deutschen 
Hörer*innen entsprechend der Sender-Selbstpositionierung zugeordnet. Beide 
Hörergruppen gaben an, sich vor allem an der Sprechweise orientiert zu haben, 
und beschrieben die Sprechweise der Sprecherin übereinstimmend häufig als mo- 
noton, mittelschnell mit wenigen Pausen und sachlich (unemotional) (siehe Ta- 
belle 2 unten). 


Meldung M2 (Audio 2): Lipetsk FM — Informationsprogramm für mittleres Er- 
wachsenenalter mit mittellauter Hintergrundmusik 

Auch dieses Beispiel wurde von beiden Gruppen (58% der deutschen und 90% 
der russischen Hörer*innen) gemäß der Sender-Selbstpositionierung dem Infor- 
mationsprogramm zugeordnet. Das Alter des Zielpublikums wurde von 50% der 
deutschen und 90% der russischen Hörer*innen entsprechend der Sender-Selbst- 
positionierung zugeordnet. Als typisch für die Sprechweise des Sprechers haben 
ca. 60% der Proband*innen beider Gruppen übereinstimmend das hohe Sprech- 
tempo vermerkt, darüber hinaus vermerkten die russischen Hörer*innen noch die 
formelle und melodische Sprechweise. 


Meldung M3 (Audio 3): Love Radio — Unterhaltungsprogramm für junges Pub- 
likum mit lauter Hintergrundmusik 

Dieses Beispiel haben beide Hörergruppen jeweils zu 98% sowohl hinsichtlich 
des Formats als auch des Zielgruppenalters gemäß der Selbstpositionierung des 
Senders identifiziert. Den Ausschlag hierfür hat nach den Angaben der Pro- 
band*innen offensichtlich die Hintergrundmusik gegeben, die fast genauso laut 
erscheint wie der Sprecher und sehr vordergründig wirkt. Die russischen Hö- 
rer*innen gaben an, auch vom Nachrichteninhalt beeinflusst worden zu sein. In 
der Meldung geht es um den Besuch eines berühmten Sängers in einer Radioshow. 


Meldung M4 (Audio 4): Radio Sieben — Unterhaltungsprogramm für mittleres 
Erwachsenenalter mit sehr leiser Hintergrundmusik 

Die Zuordnung dieses Beispiels gestaltet sich weniger eindeutig, außerdem unter- 
scheiden sich beide Hörer*innengruppen deutlich. Das Programm wurde von 82% 
der deutschen Hörer*innen als Informationsprogramm identifiziert, dagegen nur 
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von 44% der russischen Hörer*innen. Diese Zuordnung entspricht nicht der Sen- 
der-Selbstpositionierung. Bezogen auf die Zielgruppe zeigt sich, dass nur 16% der 
deutschen Hörer*innen das Beispiel entsprechend der Senderselbstauskunft zu- 
ordnen, dagegen 44% der russischen Hörer*innen. Die Unterschiede in den bei- 
den Gruppen zeigen sich auch in den Angaben zur Zuordnungsschwierigkeit: 
Während 54% der russischen Hörer*innen die Zuordnung als leicht eingeschätzt 
haben, bewerteten 42% der deutschen Hörer*innen die Zuordnung als schwierig 
(siehe Tabelle 3). 


Meldung M5 (Audio 5) Radio Rossii — Informationsprogramm für älteres Er- 
wachsenenalter ohne Hintergrundmusik 

Dieses Beispiel haben über 75% der Proband*innen in beiden Gruppen gemäß der 
Sender-Selbstpositionierung als Informationsprogramm identifiziert. Als Grund 
nannte mehr als die Hälfte aller Proband*innen die formelle Sprechweise. Als 
weiteren Grund für die Zuordnung nannten 38% der russischen Proband*innen 
das langsame Sprechtempo, demgegenüber beurteilten 30% der deutschen Pro- 
band*innen das Sprechtempo als hoch (siehe Tabelle 2 unten). 


Meldung M6 (Audio 6): Radiola — Unterhaltungsprogramm für vorwiegend 
weibliches Publikum im mittleren Erwachsenenalter mit mittellauter Hinter- 
grundmusik 

Bezüglich des Programms zeigt sich ein uneinheitliches Bild: 90% der russischen 
Proband*innen haben das Beispiel als Informationsformat identifiziert, was der 
Sender-Selbstpositionierung widerspricht. Als Gründe gaben sie den sachlich- 
neutralen Inhalt und die ruhige, sachliche Sprechweise an. Für 48% der deutschen 
Proband*innen klingt das Beispiel überhaupt nicht wie eine Nachrichtenmeldung 
(Abbildung 5 unten), sondern eher wie eine Werbung oder wie eine Zwischenmo- 
deration zwischen zwei Musiktiteln. Bezüglich des Zielgruppenalters zeigt sich 
ein relativ einheitliches Bild: Beide Gruppen haben es mehrheitlich gemäß der 
Sender-Selbstpositionierung zugeordnet. 


Meldung M7 (Audio 7): Svoboda — Informationsprogramm für mittleres Er- 
wachsenenalter ohne Hintergrundmusik 

Dieses Beispiel haben beide Gruppen zu über 75% gemäß der Sender-Selbstposi- 
tionierung als Informationsprogramm identifiziert. Als Grund nannte mehr als die 
Hälfte aller Proband*innen die formelle Sprechweise. 58% der russischen Pro- 
band*innen gaben als weiteren Grund für die Zuordnung das langsame Sprech- 
tempo an. Demgegenüber beurteilten die deutschen Proband*innen das Sprech- 
tempo uneinheitlich (28% als langsam und 32% als hoch) (siehe Tabelle 2 unten). 
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In ihren Kommentaren erwähnen die Befragten häufig explizit das Fehlen der 
Hintergrundmusik (26% der deutschen und 16% der russischen Hörer*innen). 


Meldung M8 (Audio 8): Zvezda — Unterhaltungsprogramm für mittleres Erwach- 
senenalter mit lauter Hintergrundmusik 

Dieses Beispiel wurde von beiden Gruppen zu jeweils 84% abweichend von der 
Senderselbstauskunft als Informationsprogramm identifiziert. Das Alter der Ziel- 
gruppe wurde dagegen gemäß der Sender-Selbstpositionierung erkannt. Als 
Grund für die Zuordnung haben beide Hörergruppen die formelle Sprechweise 
angegeben, aber auch die Hintergrundmusik (26% der deutschen und 16% der 
russischen Hörer*innen). Die meisten Kommentare der deutschen Hörer*innen 
beziehen sich darüber hinaus auf das schnelle Sprechtempo und die monotone 
Sprechweise (siehe Tabelle 2 unten). Dagegen vermerkten die russischen Hö- 
rer*innen ein langsames Sprechtempo (32%), eine ausdrucksstarke Sprechwiese 
(40%) und viele bzw. genug Sprechpausen (42%). 


3.3.2 Hörerseitige Begründung der Formatidentifikation 


Bei der Angabe von Gründen für die Formatzuordnung haben sich sowohl die 
deutschen als auch die russischen Hörer*innen überwiegend an den beispielhaft 
angeführten Merkmalen im Fragebogen orientiert (siehe Abbildung 1 oben: 
schnell / langsam, viele / wenige Pausen, formell / informell, melodisch / mono- 
ton, gespannt / entspannt, Gesamtwirkung...). Besonders häufig wurden dabei ho- 
hes Sprechtempo, formelle (seltener informelle) und monotone (seltener melodi- 
sche) Sprechweise genannt (siehe Tabelle 2). 


Hörbei- Beschreibungen der Sprechweise 
< z - Nennungen 

spiel/Hö- | schnell | langsam formell | infor- | mono- | melo- | ;, sgesamt 
rergruppe mell ton disch 

MI De 32 1 23 3 3 26 88 

M1 Ru 17 3 26 3 7 13 69 

M2 De 20 2 19 9 16 3 69 

M2 Ru 17 10 18 3 22 3 73 

M3 De 29 3 17 15 11 11 86 

M3 Ru 28 0 31 29 2 21 111 

M4 De 18 4 27 2 4 22 77 

M4 Ru 19 6 26 20 8 19 98 

M5 De 15 8 11 3 21 4 62 

M5 Ru 9 19 28 3 13 17 89 

M6 De 10 9 23 6 15 5 68 
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Hörbei- Beschreibungen der Sprechweise 
E a = Nennungen 

spiel / Hö- | schnell | langsam | formell | infor- | mono- | melo- insgesamt 
rergruppe mell ton disch 

M6 Ru 1 6 8 2 4 3 24 

M7 De 16 14 21 2 17 4 74 

M7 Ru 3 29 25 1 20 10 88 

M8 De 32 9 23 5 3 26 98 

M8 Ru 8 16 26 0 11 17 78 


Tab. 2: Häufige Begründungen für die Formatidentifikation 


Beide Hörergruppen sollten auch angeben, ob sie ihre Formatidentifikation eher 
von der Sprechweise oder von der Hintergrundmusik abhängig gemacht haben 
(Abbildung 4). 


100% 
90% 
80% 
70% 
eur E Keine Angabe 
a E Sprechstil/eher Sprechstil 
40% i 
beides 
30% 
20% m Musik/eher Musik 
10% 


0% 
M1 M1 M2 M2 M3 M3 M4 M4 M5 M5 M6 M6 M7 M7 M8 M8 
De Ru De Ru De Ru De Ru De Ru De Ru De Ru De Ru 


Abb. 4: Einfluss von Sprechstil vs. Hintergrundmusik auf die Formatidentifikation 


Aus der Abbildung 4 geht hervor, dass beide Gruppen bei der Formatidentifika- 
tion nach eigenen Angaben durch die Sprechweise beeinflusst wurden. An den 
Beispielen M6 und M8 (zu einem gewissen Anteil auch in den Beispielen M1 und 
M2) wird deutlich, dass die deutschen Hörer*innen ihre Zuordnung neben der 
Sprechweise auch von der Musik abhängig gemacht haben. Eine Ausnahme bildet 
das Beispiel M3, bei dem beide Gruppen sich vorrangig an der Musik orientiert 
haben. 
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3.3.3 Hörerseitige Bewertung der Zuordnungsschwierigkeit und des Nach- 
richtenklangs 


Die russischen Hörer*innen gaben überwiegend an, dass die Formatidentifikation 
für sie leicht (durchschnittlich 60%) oder mittelschwer (durchschnittlich 35%) ge- 
wesen ist. Bei den deutschen Hörer*innen ist das Bild weniger eindeutig, hier 
finden sich Angaben von leicht (durchschnittlich 25%) über mittelschwierig 
(durchschnittlich 47%) bis schwierig (durchschnittlich 25%) (vgl. Tabelle 3). 


Zuordnung 
Hörbei- leicht mittel schwierig 

spiel dt. Hö. russ. Hö. dt. Hö. | russ. Hö. | dt. Hö. | russ. Hö. 
M1 9 (18%) | 31(62%) | 28 (56%) | 16 (32%) | 12 (24%) | 3 (6%) 
M2 15 (30%) | 23 (46%) | 18 (36%) | 23 (46%) | 11 (22%) | 4(8%) 
M3 19 (38%) | 39 (78%) | 26(52%) | 10 (20%) | 510%) | 12%) 
M4 7 (14%) 27 (54%) 20 (40%) | 19 (38%) | 21 (42%) | 3 16%) 
M5 15 (30%) | 29(58%) | 24(48%) | 18 (36%) | 9 (18%) | 2 (4%) 
M6 6 (12%) | 21(42%) | 33 (66%) | 25 (50%) | 8 (16%) | 4(8%) 
M7 15 (30%) | 29 (58%) | 29 (58%) | 20 (40%) | 48%) 0 
Ms 19 (38%) | 26 (52%) | 26 (52%) | 23 (46%) | 5 (10%) | 10%) 

insgsamt 105 225 204 139 75 18 


Tab. 3: Angaben zur Zuordnungsschwierigkeit 


Die deutschen Hörer*innen haben die Frage danach, ob die Hörbeispiele wie 
Nachrichten klingen oder nicht, folgendermaßen beantwortet (Abbildung 5): 


100% = 
80% 


70% 
60% 
50% 


m eher nicht 
40% 
30% eher ja 
o 
20% E ja 
M1 M2 M3 M4 M5 M6 M7 M8 


Abb. 5: Einschätzung des Nachrichtenklangs durch die deutschen Hörer*innen 


Keine Angabe 


E nicht 


Die Hörbeispiele M1, M2 und M8 haben nach mehrheitlicher Einschätzung der 
deutschen Hörer*innen (mehr als 50% der Urteile ja — eher ja) einen typischen 
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Nachrichtenklang. Dagegen klingt das Beispiel M3 nach Einschätzung der deut- 
schen Hörer*innen (68% der Urteile) nicht wie Nachrichten. Wenn die deutschen 
Hörer*innen ein Hörbeispiel als nachrichtenuntypisch eingeschätzt haben, haben 
sie mehrfach als Grund folgende andere Genre-Anmutungen angegeben: 


- Anmoderation, Wetterbericht, Reportage, Dokumentation (Informations- 
programme) 

- Werbung, Wetterbericht; cool, wenig seriös, entspannt, weniger schnell, in- 
formell (Unterhaltungsprogramme) 


4 Fazit 


Die Selbstpositionierungen der russischen Radiosender im Internet zeigen, dass 
hinsichtlich des Formatbezugs für russische Radionachrichten ähnliche Format- 
kategorien wie für deutsche oder amerikanische gelten. Das Hörexperiment zeigt, 
dass die Anmutung aktueller russischer Radionachrichten mittels Sprechstil und 
Hintergrundmusik so eindeutig gestaltet ist, dass der Formatbezug unabhängig 
vom Sprachverständnis deutlich erkennbar ist: Beide Hörergruppen haben über- 
einstimmend das Format von fünf der acht Hörbeispiele gemäß der Sender-Selbst- 
positionierung identifiziert: 


- beiden Beispielen 3, 5 und 7 das Programm (Information vs. Unterhaltung) 
mit mehr als 75% Übereinstimmung 

- bei den Beispielen 1 und 2 das Programm (Information vs. Unterhaltung) 
mit mehr als 50% Übereinstimmung 


Sowohl die befragten russischen als auch deutschen Proband*innen konnten also 
für fünf Beispiele anhand einer gehörten Nachrichtenmeldung das Format des Ra- 
diosenders gemäß den Vorgaben (Unterhaltung / Information) übereinstimmend 
identifizieren. Interessant sind auch die übereinstimmenden Angaben der Hö- 
rer*innen zum Hörbeispiel M8: 50% der deutschen und 84% der russischen Pro- 
band*innen haben dieselbe Programm-Zuordnung getroffen (Information), aller- 
dings nicht in Übereinstimmung mit der Sender-Selbstpositionierung 
(Unterhaltung). Als Grund für die Identifizierung eines Beispiels als Informa- 
tionsformat wird von beiden Hörergruppen überwiegend eine formelle, gelegent- 
lich auch eine monotone Sprechweise angegeben (Beispiele 1, 2, 5, 7, 8). Das 
Sprechtempo scheint keinen eindeutigen Einfluss auf diese Identifizierung zu ha- 
ben, denn es wurde in den genannten Beispielen sehr unterschiedlich beurteilt, 
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auch innerhalb jeder Gruppe. Als Grund für die Identifizierung eines Beispiels als 
Unterhaltungsformat (Beispiele 3 und 6) sowie Jugendformat (Beispiel 3) geben 
beide Gruppen, insbesondere aber die deutschen Hörer*innen, die Hintergrund- 
musik an, die russischen Hörer*innen darüber hinaus auch den Inhalt der Meldun- 
gen. 

Das Sprechtempo wird in zwei Beispielen von den russischen und deutschen 
Hörer*innen übereinstimmend beurteilt (M1: mittelschnell; M2: schnell). Aller- 
dings zeigt sich bei anderen Beispielen (M5, M7, M8) eine Diskrepanz in der 
Tempowahrnehmung: Die deutschen Hörer*innen beurteilen das Sprechtempo 
dieser Meldungen als hoch, die russischen Hörer*innen dagegen als niedrig. Das 
ist ein Hinweis darauf, dass sich die beiden Hörergruppen möglicherweise an je- 
weils unterschiedlichen muttersprachlichen Referenzen bzw. Hörgewohnheiten 
orientieren. Aufschluss hierzu wird die detaillierte phonetische Analyse des 
Sprechstils der russischen Beispiele geben (Sergeeva i. V.), vor allem in der Kon- 
trastierung zum Sprechstil aktueller deutscher Radionachrichten von Schwenke 
(2020). 


Literatur 


Boersma, P. / Weenink, D. (2017): Praat. Doing phonetics by computer. http://www.praat.org 
(28.06.2020) 

Bose, I. / Finke, C. L. (2016): Radiostimmen. Zur stimmlichen Ästhetik in aktuellen Morning 
Shows. In: Voigt-Zimmermann, S. / Kurtenbach, S. / Finkbeiner, G. / Bergt, A. / Mainka, 
M. (Hg.): Stimmstörungen — ein Fokus der Klinischen Sprechwissenschaft. Aktuelle Bei- 
träge aus Wissenschaft, Forschung und Praxis. Berlin, S. 67-92. 

Schwenke, A. (2020): Nachrichten: mehr als informativ. Nachrichten-Sprechstile im Radio 
zwischen Formatierung und Hörverständlichkeit. Berlin. 

Sergeeva, V. (i. V.): Phonostilistische Charakteristik russischer Radionachrichten. Diss. Uni- 


versität Halle (Saale) und Staatliche Universität Woronesh. 
Audioquellen 


Kommersant FM: _ http://www.brand-radio.ru/serv __idP 52 _idPl_84_idP2_3070.html 


(24.07.2020) 

Lipetsk FM: http://rekradio.ru/lipetsk-vesti-fm (24.07.2020) 

Love Radio: http://www.brand-radio.rw/serv _idP_ 52 _idPl_84_idP2_330.html 
(24.07.2020) 


© Frank & Timme Verlag für wissenschaftliche Literatur 195 


Radio Sem: 


Radio Rossii: 


Radiola: 
Svoboda: 


Zvezda: 


196 


http://www.reklama-online.ru/radio-7-na-7-holmah-voronezh/reklama- 


ceny/ (24.07.2020) 


https://voronezh.rekradio.ru/rossiya (24.07.2020) 
https://66.ru/business/news/188780/ (24.07.2020) 
https://mywebs.su/blog/politic/11365/ (24.07.2020) 
http://www.brand-radio.ru/serv_idP_52_idPl_84_idP2_3074.html 


(24.07.2020) 


© Frank & Timme Verlag für wissenschaftliche Literatur 


nachrichtenleicht — Sprachliche und sprecherische Merkmale 
eines barrierefreien Informationsangebots 


Johanne Gerhardt, Halle (Saale) / Anna Schwenke, Greifswald 


Jeder Mensch hat ein Recht auf ein barrierefreies Leben. Dies schließt auch den 
Zugang zu Informationen mit ein. Deshalb bieten nicht nur bundes- und landes- 
behördliche Webseiten, sondern auch viele öffentlich-rechtliche Radiosender In- 
formationen in Einfacher Sprache oder Leichter Sprache an. Im Folgenden wird 
die Leichte Sprache als wissenschaftlicher Gegenstand aufgegriffen und zu den 
sprechwissenschaftlichen Untersuchungen zur Hörverständlichkeit von Radio- 
nachrichten in Beziehung gesetzt. Im Rahmen einer Pilotuntersuchung werden 
Ausschnitte des Informationsangebots nachrichtenleicht des Deutschlandfunks 
hinsichtlich sprachlicher und sprecherischer Merkmale beschrieben. Die Ergeb- 
nisse dieser exemplarischen Analyse werden sprechwissenschaftlich erläutert und 
mit vorliegenden Forschungsergebnissen kontrastiert. 


1 Einleitung 


Mit dem Gesetz zur Gleichstellung von Menschen mit Behinderungen (Behinder- 
tengleichstellungsgesetz) aus dem Jahr 2002 wurde der Anspruch auf gesell- 
schaftliche Teilhabe im Sozialgesetzbuch juristisch verankert. Ein Teil dieses Ge- 
setzespakets betrifft den Abbau sprachlicher Barrieren für Menschen mit 
Lernbehinderungen oder mit geistigen Beeinträchtigungen durch die Anwendung 
des Konzepts der Leichten Sprache. Texte, Nachrichten, Beschreibungen, Anlei- 
tungen, Literatur oder auch Ausschilderungen sind oftmals für diese Menschen 
unverständlich. Leichte Sprache soll dazu dienen, „barrierefreie Kommunikation 
zu ermöglichen, indem Texte für sprachlich eingeschränkte Menschen verständ- 
lich gestaltet werden“ (Beyer 2017, 378). Denn für Menschen mit kognitiven 
und/oder sprachlichen Einschränkungen muss es Wege geben, sich über das ge- 
sellschaftliche und politische Geschehen zu informieren, z. B. durch Radionach- 
richten. In der Gestaltung von barrierefreien Hörtexten besteht die Herausforde- 
rung darin, die Regeln der Leichten Sprache, die zunächst für die Schriftsprache 
formuliert wurden (Maaß 2015, 12), auf das Sprechen zu übertragen. Denn aus 
sprechwissenschaftlichen Studien zur Hörverständlichkeit von Radionachrichten 
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ist bekannt, dass an Texte, die rein auditiv rezipiert werden, andere Vorgaben ge- 
stellt werden müssen als an reine Lesetexte (Bose 2009; et al. 2011). Um hierauf 
adäquate Antworten liefern bzw. Bezüge herstellen zu können, erfolgt zunächst 
die Auseinandersetzung mit den Prinzipien der Leichten Sprache als mögliche 
Basis für Anschlussuntersuchungen (siehe Apel / Bose / Schwenke in diesem 
Band). 

Im öffentlich-rechtlichen Rundfunk existieren inzwischen viele Informations- 
angebote in Leichter Sprache, v. a. als Lesetexte, aber zunehmend auch als Hör- 
texte in Form von Podcasts oder wöchentlichen Sendeterminen. Beispielsweise 
wird das Angebot nachrichtenleicht des Deutschlandfunks seit 2001 einmal wö- 
chentlich ausgestrahlt; anders als der Titel suggeriert basiert das Angebot jedoch 
nicht ausschließlich auf den Regeln der Leichten Sprache, sondern liefert laut 
Senderselbstauskunft „Nachrichten in einfacher Sprache“ (Internetquelle 1). Die 
folgende Analyse des Informationsangebots nachrichtenleicht schließt einerseits 
an bereits bestehende Untersuchungen zu zielgruppenspezifischen Radionach- 
richten an und erweitert damit den Kanon sprechwissenschaftlicher Nachrichten- 
analysen. Andererseits fungiert die nachrichtenleicht-Analyse als Bindeglied zwi- 
schen Untersuchungen zu Sprechstil(een) sowie zur Hörverständlichkeit 
konventioneller Nachrichten und dem Angebot barrierefreier Informationsfor- 
mate. 


2 Sprechwissenschaftliche Forschung zu hörverständlichen 
Radionachrichten 


Radionachrichten werden definiert als journalistische Darstellungsform zur Ver- 
mittlung von Informationen, die von öffentlichem Interesse sind. Dies geschieht 
in knapper und wertungsfreier, d.h. objektiver und sachlicher Weise (vgl. 
Schwiesau / Ohler 2016, 79; Schwenke 2020, 29). Besonders ist, dass sie schrift- 
lich konstituiert sind, aber mündlich realisiert werden; es handelt sich also um ein 
„Öffentliches medienvermitteltes Vorlesen“ (Apel et al. 2018, 279). Im Allgemei- 
nen zeichnen sich Radionachrichten durch eine starke informative Verdichtung 
aus, z. B. durch Nominalphrasen und Partizipialkonstruktionen. Die sprecherische 
Realisierung ist stark konventionalisiert und durch typische sprecherische Merk- 
male geprägt: hohes Sprechtempo, häufige und in regelmäßigen Abständen ge- 
setzte Pausen und Zäsuren, hohe Akzentdichte, geringe Melodiebewegungen und 
ein begrenzter Tonhöhenumfang. Da die Rezipient*innen in der eigentlichen 
Kommunikationssituation nicht auf das Gesagte reagieren können (vgl. Guten- 
berg, 2005, 48), kann Verständnissicherung nicht durch Nachfragen erfolgen. 
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Eine an die Sprech-Hör-Situation angepasste sprachlich-sprecherische Gestaltung 
ist daher von besonderer Bedeutung für die Hörverständlichkeit. 

Hörverständlichkeit wird definiert als „die um die Prosodie erweiterte Textver- 
ständlichkeit“ (Apel et al. 2018, 280): Texte, die für das Hören — und nicht nur für 
das Lesen — geschrieben werden, müssen besondere verständlichkeitssichernde 
Kriterien erfüllen, z. B. in Form einfacher und kurzer Sätze, durch die Vermei- 
dung von Fremdwörtern und Fachwortschatz sowie durch die Übereinstimmung 
von Informationsschritt und Satz (d. h. pro Satz nur eine neue Information) (vgl. 
stellvertretend Gutenberg 1994). Ausgehend von der Annahme eines besonderen 
Wechselspiels zwischen geschriebenem Text (inhaltlicher Aufbau und Sprachstil) 
und der sprecherischen Realisierung (prosodische Merkmale und Sprechstil) mit 
Einfluss auf das Behalten und Verstehen, betrachten sprechwissenschaftliche 
Analysen insbesondere auch Merkmale der sprecherischen Präsentation (u. a. 
Gliederung, Akzentuierung, Sprechtempo und Pausierung). Das Gliedern, also 
das Segmentieren des Textes in inhaltlich-semantische und prosodische Einhei- 
ten, ermöglicht Hörer*innen, der Informationsanordnung zu folgen; die Akzentu- 
ierung der wichtigen und neuen Informationen innerhalb einer Gliederungseinheit 
hilft, die entscheidende Information herauszufiltern. Das Sprechtempo, aber ins- 
besondere die Pausengestaltung spielen ebenfalls eine wesentliche Rolle für die 
Hörverständlichkeit. Sprechwissenschaftliche Untersuchungen zu Leichter Spra- 
che liegen bisher nicht vor, jedoch kann sowohl an die Ergebnisse bereits durch- 
geführter Studien zur Hörverständlichkeit von Radionachrichten angeknüpft wer- 
den (vgl. Gutenberg 2005, Bose 2009, Apel 2018, Schwenke 2020; siehe auch 
Apel / Schwenke in diesem Band) als auch an Untersuchungen von Nachrichten 
für spezifische Zielgruppen, z.B. Untersuchungen zu Kindernachrichten 
(Leuchte 2015) und zu langsam gesprochenen Nachrichten (Schwenke et al. 
2015). 


3 Leichte Sprache: Begriff und Merkmale 


In der Verständlichkeitsforschung wird davon ausgegangen, dass das Lesen eines 
Textes ein „aktiver Prozess der Bedeutungskonstruktion“ ist (Christmann 2017, 
37). Der Lesevorgang ist demzufolge ein Sinnverstehen in Form einer Wechsel- 
wirkung zwischen den Merkmalen des vorgegebenen Textes und der Kognitions- 
struktur der Rezipient*innen. Diese Text-Leser*in-Interaktion ist für die Erfor- 
schung Leichter Sprache besonders relevant, weil es sich um eine spezifische 
Gruppe von Adressat*innen handelt. Das heißt, dass allgemeine und empirisch 
belegte Verständlichkeitsprinzipien (sprachliche Einfachheit, semantische Kürze, 


© Frank & Timme Verlag für wissenschaftliche Literatur 199 


kognitive Gliederung / Ordnung; vgl. für einen Überblick Apel 2018) unter Um- 
ständen nicht ausreichend greifen, um die erhoffte Wirkung — die Informations- 
vermittlung an die spezifische Zielgruppe — zu erreichen (vgl. Christmann 2017, 
37-45). 


Der Begriff Leichte Sprache ist zu einem schillernden Schlagwort geworden, un- 
ter dem mitunter Unterschiedliches subsumiert wird. Gleichzeitig gibt es ver- 
schiedene Bezeichnungen, die gleiche oder zumindest ähnliche Ansätze der Kom- 
munikationsoptimierung beschreiben.“ (Bock 2015, 82; Kursivierung JG / AS). 
Es ist von Leichter Sprache, einfacher Sprache, bürgernaher Sprache sowie 
Leicht Lesen die Rede (vgl. ebd., 83). Als elementares Ziel aller Ansätze gilt, 
Kommunikation, die bestimmten Personengruppen unzugänglich ist, schrift- 
sprachlich zugänglich zu machen (vgl. Lange / Bock 2016, 123). 

Maaß (2015, 11) bezeichnet Leichte Sprache als „Varietät des Deutschen, die 
im Bereich Satzbau und Wortschatz systematisch reduziert ist“. Was die Leichte 
Sprache von anderen Konzepten unterscheidet, ist eine spezifischere Zielgruppe 
sowie ein festes Regelwerk. Durch eine Anpassung der (Schrift-)Sprache an die 
kognitiven und sprachlichen Fähigkeiten der Adressat*innen werden Verstehen, 
kommunikatives Handeln und somit Teilhabe ermöglicht. Jedoch kann eine adä- 
quate Anpassung der Sprache nur gelingen, wenn die Zielgruppe und ihre Fähig- 
keiten bekannt sind, denn „Kommunikationsoptimierung muss immer in Bezug 
auf eine bestimmte Adressatengruppe erfolgen“ (Bock 2015, 80). Generell stellt 
sich die Frage, „inwiefern es möglich ist, die verschiedenen Einschränkungen und 
Kompetenzprofile [...] mit einem einzigen Ansatz zu ‚bedienen‘“ (ebd.). Daher 
ist es notwendig, die Leistungsfähigkeit der Konzepte theoretisch wie auch prak- 
tisch zu evaluieren (vgl. ebd.). Da das Konzept der Leichten Sprache aus der Pra- 
xis heraus entstanden ist (vgl. Maaß 2015, 10), steht die wissenschaftliche Ausei- 
nandersetzung erst am Anfang. Einige Untersuchungen zur empirischen 
Überprüfbarkeit der Leichte-Sprache-Regeln liegen aber bereits vor, z. B. im Be- 
reich Negation (vgl. Bredel et al. 2016). 


Die Regeln der Leichten Sprache existieren insbesondere als Sprach- und Typo- 
grafieregeln und sind als kodifizierte Normen in Regellisten festgehalten. Als ver- 
breitete und allgemein gültige Kataloge sind folgende zu nennen: Die Regeln für 
Leichte Sprache des Netzwerks Leichte Sprache (Internetquelle 2), das BITVY 2.0 
(Verordnung zur Schaffung barrierefreier Informationstechnik nach dem Behin- 
dertengleichstellungsgesetz) (Internetquelle 3) und die Check-Liste von /nclusion 
Europe (Internetquelle 4). Die Forschungsstelle Leichte Sprache an der Universi- 
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tät Hildesheim hat diese drei Regelwerke evaluiert und auf Grundlage der aktuel- 
len Forschungslage ein eigenes Regelwerk erstellt (vgl. Maaß 2015), worin im 
Gegensatz zu den anderen aus der Praxis stammenden Regelsammlungen ausführ- 
liche linguistische Begründungen dargelegt werden. Als wichtigste Regeln bzw. 
Merkmale der Leichten Sprache auf Textebene sind folgende zu nennen: 


- möglichst kurze Wörter und Grundwortschatz verwenden; Fach- und 
Fremdwörter sowie schriftbasierten Abkürzungen vermeiden (ebd., 95-99) 

- verbal statt nominal formulieren (ebd., 102-103) 

- Passiv, Genitiv, Konjunktiv und Präteritum vermeiden (Ausnahme: Modal- 
und Hilfsverben dürfen im Präteritum stehen) (ebd., 103-107, 120-123) 

- eine Aussage pro Satz nennen, ohne Nebensätze oder Kommata (ebd., 108- 
110) 

-  Negationen vermeiden oder mit nicht realisieren (ebd., 126-128) 


Leichte Sprache ist in erster Linie für Lesetexte konzipiert; sowohl die Ratgeber- 
literatur (Handreichungen mit Regellisten) als auch die veröffentlichten wissen- 
schaftlichen Artikel und Buchpublikationen beziehen sich ausschließlich auf 
schriftliche Texte und deren Layout. Untersuchungen zur gesprochenen Sprache 
oder zum Vorlesen existieren bislang nicht (vgl. Bock et al. 2017, 12). Auch aus 
Ratgebern lassen sich nur sehr wenige und eher allgemein gehaltene Hinweise 
zum Sprechen finden, wie z. B. in der Handreichung zur Gestaltung von Tagun- 
gen in Leichter Sprache (vgl. Internetquelle 5). Dort wird darauf hingewiesen, 
langsam und deutlich zu sprechen. 


4 _ Pilotuntersuchung zu sprachlichen und sprecherischen 
Merkmalen von nachrichtenleicht-Meldungen 


Im Vergleich zu den täglich und regelmäßig ausgestrahlten Nachrichten im Radio 
richten sich die nachrichtenleicht-Meldungen an ein spezifisches Publikum, z. B. 
an Hörer*innen mit kognitiven Einschränkungen. Die sprachliche Gestaltung die- 
ses Nachrichtenformats orientiert sich — wie in der Einleitung erwähnt — nicht 
ausschließlich an den Regeln der Leichten Sprache, sondern bildet „Nachrichten 
in einfacher Sprache“ ab (vgl. Internetquelle 1). Untersuchungen, ob und wie sich 
einfach geschriebene Texte bzw. Leichte-Sprache-Texte auch für das Radio und 
zum ausschließlichen Hören eignen, gibt es bis dato nicht. Sprechwissenschaftli- 
che Beschreibungen von Leichte-Sprache-Hörtexten im Allgemeinen und von 
nachrichtenleicht-Meldungen im Besonderen liegen bisher ebenso wenig vor wie 


© Frank & Timme Verlag für wissenschaftliche Literatur 201 


konkrete Vorgaben zum hörverständlichen Sprechen dieser oder ähnlicher Texte. 
Um einen ersten Einblick in diese Forschungsrichtung zu eröffnen, geht die vor- 
liegende Pilotuntersuchung zunächst auf generelle Fragen der sprachlichen und 
sprecherischen Gestaltung der nachrichtenleicht-Meldungen im Kontrast zu kon- 
ventionellen Nachrichten ein. Gefragt wird auch, inwiefern die nachrichtenleicht- 
Texte als hörverständlich beschrieben werden können. 


4.1 Korpus und Methode 


Nachrichtenleicht werden vom Deutschlandfunk jeden Freitag ausgestrahlt und 
können zusätzlich auf einem Online-Nachrichtenportal als Audiodatei oder in 
Textform abgerufen werden. Die Meldungen können vier Kategorien zugeordnet 
werden: Nachrichten, Kultur, Sport und Vermischtes. Die Länge der Audioda- 
teien variiert zwischen einer und zwei Minute/n. In der vorliegenden Pilotstudie 
wurden zehn Meldungen des Onlineportals aus der Kategorie Nachrichten analy- 
siert. Der Erhebungszeitraum umfasst ca. zwei Monate (29.03.2019 bis 
03.05.2019). Da die Meldungen sprecherisch unterschiedlich umgesetzt sind, 
wurde bei der Zusammenstellung des Korpus versucht, die Bandbreite der spre- 
cherischen Realisierungen über den gewählten Zeitraum abzubilden. Deswegen 
wurden nach auditivem Ersteindruck Meldungen von zehn verschiedenen Spre- 
cher*innen mit unterschiedlicher sprecherischer Wirkung ausgewählt. Außerdem 
wurde ein ausgewogenes Geschlechterverhältnis angestrebt. 


Meldung |Meldunsgstitel Sprecher*in Datum der Länge 
Veröffentlichung in sec. 
M01 Keine Schiffe mehr Sprecher 1 29.03.2019 106,57 
M02 Mehr Inklusion Sprecher 2 19.04.2019 117,95 
M03 Wahl in Finnland Sprecher 3 19.04.2019 76,63 
M04 Gegen sexuelle Gewalt im Krieg {Sprecher 4 26.04.2019 104,99 
M05 Spanien hat gewählt Sprecher 5 03.05.2019 100,53 
M06 Mehr Rechte für Künstler Sprecherin 1 29.03.2019 114,11 
M07 Diskussion um Organspende Sprecherin 2 05.04.2019 135,87 
M08 Neuer Termin für EU-Austritt |Sprecherin3 12.04.2019 78,07 
M09 Terroranschläge in Sri Lanka Sprecherin 4 26.04.2019 93,24 
M10 Proteste am 1. Mai Sprecherin5 03.05.2019 111,01 


Tab. 1: Korpus der Untersuchung; 10 Meldungen von 10 Sprecher*innen 
Die Analyse umfasste die exemplarische Beschreibung einer Meldung im Hin- 


blick auf Leichte-Sprache-Merkmale, die Beschreibung ausgewählter sprachli- 
cher Merkmale aller zehn Meldungen bezogen auf das Forschungsprojekt zur 
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Hörverständlichkeit von Radionachrichten sowie die auditiv-akustische Analyse 
ausgewählter sprecherischer Merkmale aller zehn Meldungen. 


4.2  Exemplarische Analyse einer nachrichtenleicht-Meldung nach 
Merkmalen der Leichten Sprache 


Die hier beispielhaft durchgeführte Analyse bezieht sich ausschließlich auf die 
Meldung 1. Beschrieben werden Aspekte der Informationsstruktur (Satzlänge, 
Satzkomplexität und -aufbau) sowie weitere sprachliche Merkmale (Tempus und 
Genera Verbi, Pronomen und Negationen). Als Orientierung dient das Regelbuch 
zur Leichten Sprache von Maaß (2015). 


Informationsstruktur: Alle 20 Sätze der Meldung 1 sind einfach strukturiert; 
deshalb interessiert, wie die Informationen in den Meldungen angeordnet werden. 
Nach den Regeln der Zeichten Sprache sollte nur eine Aussage pro Satz geschrie- 
ben werden; nähere Erläuterungen, Ergänzungen, Auflistung o. Ä. sind in einem 
zusätzlichen Satz unterzubringen (vgl. ebd., 108-109; siehe auch Kap. 2). Der 
erste Satz der Meldung, der sog. Leadsatz, weicht allerdings von diesem Prinzip 
ab: 


[Die europäische Union] hat [das Mittelmeer] [vier Jahre lang] 
[mit Schiffen] [kontrolliert]. 


Bsp. 1: Meldung 1, Satz 2; Menge neuer Informationen 


Mit dem Leadsatz wird eine Nachrichtenmeldung eingeleitet, indem die Themen 
der Meldung etabliert werden. Üblich ist die Platzierung mehrerer Informationen 
(siehe Beispiel 1): Der Handlungsträger [Die europäische Union], das finite 
Verb [hat kontrolliert] sowie das Objekt [das Mittemeer] sind nicht nur 
neue relevante Informationen des einleitenden Satzes, sondern auch entsprechend 
grammatisch miteinander verknüpft. [Die Schiffe] werden zwar vorher im Ti- 
tel bzw. in der Schlagzeile der Meldung genannt und damit eingeführt, allerdings 
ist die temporale Angabe im Mittelfeld [vier Jahre lang] eine zusätzliche 
Information, die prinzipiell auch in einen Folgesatz platziert werden könnte. Dass 
pro Satz nicht nur eine einzige Information gegeben wird, lässt sich auch in ande- 
ren Sätzen finden. 

Im Beispiel 2 (siehe Folgeseite) werden genaugenommen zwei Informationen 
mitgeteilt. Abgesehen davon, dass diese beiden Informationen auf zwei Sätze ver- 
teilt werden könnten, weicht Beispiel 2 von den Leichte-Sprache-Regeln auch 
hinsichtlich der Satzkomplexität ab. Denn: „Die Regelwerke sind sich darin einig, 
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dass Sätze nicht komplex sein sollen, sondern kurz und inhaltlich einfach. Das 
führt in letzter Konsequenz dazu, dass alle Formen von Nebensätzen oder Auf- 
zählungen vermieden werden sollten.“ (ebd., 109). 


[So heißt ein Flüchtlingskind], [das auf einem der EU-Schiffe 
geboren wurde]. 


Bsp. 2: Meldung 1, Satz 7; zwei Aussagen pro Satz 


Tempus und Genus Verbi: Laut Regelwerk soll das Präsens die bevorzugte Zeit- 
form sein, als Vergangenheitsform wird das Perfekt empfohlen (vgl. ebd., 122). 
Dies spiegelt die betrachtete Meldung im Großen und Ganzen wider, auffällig ist 
jedoch der häufige Wechsel zwischen Präsens und Perfekt. Dazu kommt, dass der 
vierte Satz der Meldung im Präteritum formuliert ist (siehe Beispiel 3): 


Deswegen [gab] es Streit mit dem Land Italien. 


Bsp. 3: Meldung 1, Satz 3; finites Verb im Präteritum 


In der ganzen Meldung findet sich lediglich eine Passivkonstruktion (siehe Bei- 
spiel 4). Den Leichte-Sprache-Regeln entsprechen würde die Meldung dann, 
wenn sie als Aktivsatz formuliert wäre und der Handlungsträger [die EU] be- 
nannt werden würde. 


Die Flüchtlinge [sollen] in andere Länder [gebracht werden]. 


Bsp. 4: Meldung 1, Satz 16; Passivkonstruktion 


Negationen und Pronomina: In der betrachteten Meldung finden sich vier Ne- 
gationen: dreimal in der Formulierung [keine Schiffe mehr] und einmal in 
der direkten Rede: [wir wollen das nicht mehr]. Laut Regelwerk sollen 
Negationen, wenn sie unvermeidbar sind, mit ‚nicht‘ realisiert und fett hervorge- 
hoben werden (vgl. ebd., 126). Zum Umgang mit Personalpronomen findet sich 
in der betrachteten Meldung ein Satz, der besonders auffällig ist: 


[sie] haben [sie] meistens nach Italien gebracht. 


Bsp. 5: Meldung 1, Satz 14; Verwendung von Pronomen 
Das erste Personalpronomen referiert auf die EU-Schiffe, das zweite steht für die 


Flüchtlinge. Diese Satzglieder stehen zwar im Satz davor, aber es besteht die Ge- 
fahr der falschen Zuordnung. Denn die Pronomen unterscheiden sich weder im 
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Schriftbild noch im Klang. Außerdem könnte das [Sie] am Satzanfang durch die 
Großschreibung mit der höflichen Anrede verwechselt werden. Zum Gebrauch 
der Pronomen in Leichter Sprache schreibt Maaß (ebd., 133), dass die Verwen- 
dung der 1. und 2. Person i. d. R. unproblematisch sei, da der Bezug oftmals klar 
sei. Auch das ‚expletive es‘ (ebd., 135), d. h. ein ‚es‘ ohne „wieder aufnehmenden 
Bezug zu vorangegangenen Nomen“ (ebd.; siehe Beispiel 3), darf verwendet wer- 
den, wenn es sich um geläufige Formulierungen handelt. Problematisch könnte es 
mit Personalpronomen der 3. Person wie im Beispiel 5 werden, weil Pronomen 
stellvertretend für eine Gruppe, einen Gegenstand oder Umstand stehen (ebd., 
134) oder weil es zu Verwechslungen zwischen höflicher Anrede (Sie) und der 
weiblichen Form der 3. Person Singular oder Plural (sie — das Mädchen; sie — die 
Menschen) kommen kann. Leser*innen bzw. Hörer*innen müssen diese Referenz 
erst entschlüsseln. Deswegen empfiehlt Maaß (ebd., 134), auf Personalpronomen 
der 3. Person gänzlich zu verzichten und stattdessen die entsprechenden Nomen 
zu benennen. 

Deutlich wird, dass die Regeln der Leichten Sprache üblichen Formulierungs- 
routinen konventioneller Nachrichten widersprechen bzw. das „Übersetzen“ von 
Agenturmeldungen in barrierefreie Sprache ein prinzipielles Umdenken erfordert. 
Diese für die Meldung 1 festgestellten Beobachtungen waren auch bei den Mel- 
dungen 2 bis 10 zu erkennen. 


4.3 Analyse sprachlicher Merkmale nach Kriterien der 


Hörverständlichkeit 
Meldung [Anzahl der [Anzahl der [Anzahl der Ø Satzlänge Ø Wort- 
Sätze Wörter Silben länge 
in Wörtern lin Silben jin Silben 
M01 20 160 280 8,0 14,0 1,8 
M02 16 180 353 11,3 22,1 2,0 
M03 16 132 270 8,3 16,9 2,0 
M04 17 170 306 10,0 18,0 1,8 
M05 16 128 235 8,0 14,7 1,8 
M06 21 208 319 9,9 15,2 1,5 
M07 18 168 336 9,3 18,7 2,0 
M08 12 110 215 9,2 17,9 2,0 
M09 18 134 252 7,4 14,0 1,9 
M10 18 184 321 10,2 17,8 1,7 
Ø 17,2 157,4 288,7 9,2 16,9 1,9 


Tab. 2: Umfang der Meldungen und durchschnittliche Satz- und Wortlänge 
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Die Beschreibung sprachlicher Merkmale orientiert sich an Kriterien, die u. a. im 
Rahmen der sprechwissenschaftlichen Untersuchungen zur Hörverständlichkeit 
von Radionachrichten zugrunde gelegt wurden (vgl. Bose et al. 2011). Der Fokus 
liegt auf der Ermittlung der Satzlänge (aller 10 Meldungen; siehe Tabelle 2) sowie 
der Beschreibung der Satzkomplexität (Anzahl und Anordnung der Satzglieder 
und Satzklammern) und der Wortwahl (anhand der Meldungen 1, 5 und 7; siehe 
Beispiele 6 bis 13). Bei der Ermittlung der Satzlänge wurden auch die Meldungs- 
überschriften als Satz betrachtet. Generell sind die Sätze der Meldungen kurz; sie 
bestehen durchschnittlich aus 9,1 Wörtern bzw. 16,9 Silben (siehe Tabelle 2). 

Im Allgemeinen überwiegt der Anteil einfacher Sätze; zusammengesetzte bzw. 
komplexe Sätze sind viel seltener. Nominalphrasen und Passivkonstruktionen 
kommen in keiner der Meldungen vor; Fachwörter werden vermieden oder erklärt 
(z. B. Organspendeausweis, sexuelle Gewalt o. ä.). Zur weiteren Beschreibung 
der Satzkomplexität sowie der Wortwahl werden die Meldungen 1, 5 und 7 her- 
angezogen: In der Meldung 1 können 3 von 20 Sätzen als komplex bezeichnet 
werden; bei Meldung 5 sind 2 von 16 Sätzen komplex. Eine Ausnahme stellt Mel- 
dung 7 dar: Hier sind 10 der 18 Sätze als zusammengesetzt bzw. komplex zu be- 
schreiben. Während in Meldung 1 und 5 insbesondere auch die Wiedergabe von 
direkter Rede zu den komplexeren Satzstrukturen gerechnet wurde (Beispiel 6 
und 7), finden sich in der Meldung 7 sogar Sätze mit drei finiten Verbformen 
(Beispiel 8). Dies ist einer der längsten und komplexesten Sätze, die im Korpus 
beobachtet werden konnten. Im Gegensatz dazu finden sich auch sehr kurze Sätze 
in Subjekt-Prädikat-Objekt-Reihenfolge (Beispiel 9): 


Seit 2018 sagt die Regierung von Italien: Wir wollen das nicht mehr. 


Bsp. 6: Meldung 1; zusammengesetzter Satz mit direkter Rede 


Die konservative Volks-Partei hat schon gesagt: Wir gehen in die 
Opposition. 


Bsp. 7: Meldung 5; zusammengesetzter Satz mit direkter Rede 


Andere Politiker sagen: Wir wollen, dass die Menschen regelmäßig 


gefragt werden, ob sie Organspender sein wollen oder nicht. 


Bsp. 8: Meldung 7; komplexer, zusammengesetzter Satz 


Das sind Kriminelle. 


Bsp. 9: Meldung 1; einfacher Subjekt-Prädikat-Objekt-Satz 
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In keiner Meldung kommt eine übermäßige Besetzung des Vorfelds oder des Mit- 
telfeldes vor. Im Vorfeld befinden sich zumeist ein Satzglied (Beispiele 10, 11 
und 12) bis maximal zwei Satzglieder (Beispiel 13). Im Vergleich zu den anderen 
Sätzen zeigen die Beispiele 10 und 11 ein relativ großes bzw. stark besetztes Mit- 
telfeld: 


[Die EU-Schiffe] haben [immer wieder] [Flüchtlinge] [aus kaputten 
Booten] gerettet. 


Bsp. 10: Meldung 1; stark besetztes, dreigliedriges Mittelfeld 


[Die Europäische Union] hat [das Mittelmehr] [4 Jahre lang] 
[mit Schiffen] kontrolliert. 


Bsp. 11: Meldung 1; eingliedriges Vorfeld, dreigliedriges Mittelfeld 


[In Deutschland] diskutieren viele Menschen über das Thema 
Organ-Spende. 


Bsp. 12: Meldung 7; Vorfeld mit einem Satzglied 


[In dem Vorschlag] [von den Politikern] steht: Wenn ein Mensch kein 
Organspender sein will, muss er das melden. 


Bsp. 13: Meldung 5; Vorfeld mit zwei Satzgliedern 


4.4 Analyse sprecherischer Merkmale 


Die auditiv-akustische Analyse orientiert sich an Schwenke (vgl. 2020, 220-224) 
und bezieht sich auf das Sprechtempo (Artikulations- und Verstehensgeschwin- 
digkeit), die Pausierung (mittlere Pausendauer und Pausenzeitanteil) und die Ak- 
zentuierung (Akzentdichte) der Meldungen. Die auditiv-akustische Analyse er- 
folgte mit dem Soundanalyse-Programm Praat. Zu Beginn der Analyse wurde zu 
jeder Meldung der auditive Gesamteindruck festgehalten und durch drei Kontroll- 
hörerinnen intersubjektiviert. So konnten sprecherische Auffälligkeiten ermittelt 
werden, die sich in allen Aufnahmen zeigen: 


- Sprechtempo: überwiegend schleppend oder sehr langsam; mit 
zahlreichen, sehr langen und regelmäßig gesetzten Pausen 

- Artikulation: an vielen Stellen stark überartikuliert; Endsilben häufig 
überdeutlich realisiert 
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- Akzentuierung: viele Akzente in gleichmäßigen Abständen; Eindruck, 
dass die Sprecher*innen nahezu jedes Wort für wichtig halten 

- Sprechwirkung: sprecherisch erklärend, aber teilweise auch monoton 
bis synthetisch (Meldung 7); heiter emotionalisierend durch ausgeprägte 
Melodiesprünge (unangemessen bzw. im Widerspruch zum Thema 
Sexuelle Gewalt, Meldung 4) 


Die einzige Ausnahme ist die Meldung 3, die im Vergleich zu den anderen am 
ehesten nachrichtentypisch klingt; sie wirkt schneller gesprochen und insgesamt 
weniger überartikuliert. 


Sprechgeschwindigkeit und Pausierung 

Die durchschnittliche Artikulationsrate beträgt 3,4 Silben/Sekunden. Eine we- 
sentlich höhere Artikulationsgeschwindigkeit ist nur in der Meldung 3 zu finden, 
in welcher der Sprecher mit 4,4 Silben/Sekunden im Durchschnitt eine Silbe mehr 
pro Sekunde realisiert. Grundsätzlich ist im Vergleich zu bisherigen Untersuchun- 
gen ein erheblicher Unterschied festzustellen: Die Sprecher*innen von nachrich- 
tenleicht sprechen auffallend langsamer als diejenigen anderer Nachrichtenfor- 
mate (vgl. Kröninger 2009, 92; Schwenke et al. 2015, 114, Schwenke 2020, 250). 


Mel- [Dauer Ø Pausen- Pausen- (Geschwindigkeit 
dung gesamt reine Pau- reine dauer zeitanteil Ver- Artikula- 
senzeit Sprechzeit stehens- tions- 
in sec. in sec. in sec. in sec. in % Silben/Sekunden 
M01 1106,57 16,02 90,55 0,40 15,03 2,6 3,1 
M02 117,95 19,08 98,87 0,55 16,18 3,0 3,6 
M03 176,63 15,88 60,75 0,72 20,72 3,5 4,4 
M04 1105,00 23,03 81,97 0,38 21,93 2,9 3,7 
M05 1100,53 20,52 80,01 0,46 20,41 2,3 2,9 
M06 114,11 16,84 97,27 0,37 14,76 2,8 3,3 
M07 1135,87 26,12 109,75 0,52 19,22 2,5 3,1 
M08 178,07 11,95 66,12 0,66 15,31 2,8 3,3 
M09 193,24 18,51 74,73 0,66 19,85 2,7 3,4 
M10 1111,01 20,6 90,41 0,71 18,56 2,9 3,6 
Ø 103,90 18,86 85,04 0,54 18,20 2,8 3,4 


Tab. 3: Dauerwerte (in Sekunden), Verstehens- und Artikulationsgeschwindigkeit (in 
Silben/Sekunden) und Pausenzeitanteil (in Prozent) 


Der Anteil der Pausen an der Gesamtzeit beträgt durchschnittlich 18,2 Prozent, 


was einem sehr hohen Pausenanteil entspricht. Zum Vergleich: Im Rahmen der 
Analyse formatspezifischer Nachrichtensprechstile konnte ein Pausenzeitanteil 
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zwischen 6 Prozent (für Privatsender) und 9 Prozent (für Info-Sender) nachge- 
wiesen werden (Schwenke 2020, 252). Der für die nachrichtenleicht-Meldungen 
ermittelte hohe Pausenzeitanteil steht in unmittelbaren Zusammenhang mit der 
hohen Dichte an Gliederungseinschnitten, welche die Meldungstexte in eine Ab- 
folge von sehr kurzen prosodischen Einheiten bzw. Gliederungseinheiten unter- 
teilen. 


Gliederungseinheiten 

Bei der Feststellung von Gliederungseinheiten (GE) wurden nicht nur Pausen 
(phonetische Nullphasen) als Grenzsignale berücksichtigt, sondern auch prosodi- 
sche Kontraste (z. B. Melodie- oder Lautstärkesprünge ohne anschließende pho- 
netische Nullphase), die ebenfalls für die auditive Wahrnehmung von Gliede- 
rungseinschnitten verantwortlich sind. 


Meldung Anzahl der GE Ø Umfang der Ø Umfang der Ø Dauer der 
IGE in Wörter GE in Silben GE in sec. 

M01 46 3,5 6,1 1,96 

M02 40 4,5 8,8 2,26 

M03 26 5,1 10,4 2,34 

M04 68 2,5 4,5 1,21 

M05 49 2,6 4,8 1,63 

M06 57 3,7 5,6 1,71 

M07 57 3,0 5,9 1,93 

M08 32 3,4 6,7 2,01 

M09 35 3,8 7,2 2,14 

M10 42 4,4 7,6 2,16 

Ø 45,2 3,6 6,8 1,94 

Tab. 4: Anzahl, Umfang (in Wörter und Silben) und Dauer der Gliederungseinheiten (in 

Sekunden) 


Jeder Satz wird mit starkem Melodieabfall und damit eindeutig prosodisch abge- 
schlossen realisiert. Auffällig ist, dass die vergleichsweise kurzen Sätze (Ø 9,2 
Wörter bzw. 16,9 Silben; siehe Tabelle 2) sprecherisch noch weiter untergliedert 
werden: Einige Gliederungseinheiten bestehen nur aus einem Wort oder sehr kur- 
zen Wortgruppen und folgen sehr regelmäßig, beinahe rhythmisch aufeinander 
(siehe Beispiele 14 bis 16). Die starke Aufgliederung deckt sich mit dem auditiven 
Eindruck, dass keine zusammenhängende Meldung präsentiert wird, sondern eine 
(unverbundene) Folge einzelner Sätze. Das liegt u. a. auch daran, dass an vielen 
Stellen Gliederungseinschnitte realisiert werden, die zusammenhängende Infor- 
mationseinheiten auseinanderreißen; teilweise sogar zusammenhängende Satz- 
glieder wie im Beispiel 17. 
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SONST ist ER | AUtoMAtisch | orGANspender | | 


Bsp. 14: Meldung 7, Satz 10; starke Untergliederung 


DESwegen | SOLL großbriTANnien | JETZT NOCH einmal | 
MEHR ZEIT beKOMmen | | 


Bsp. 15: Meldung 8, Satz 10; viele Gliederungseinschnitte, rhythmisiert 


MANCHmal | Üben sie AUCH | SEXuELle | gewWALT AUS || 


Bsp. 16: Meldung 4, Satz 3; häufiges Absetzten der Wörter voneinander 


FÜR ' sexuELle geWALT | in KRIEGSgeBIEten | SOLL es in ZUkunft | 
HÄRtere | STRAfen GEben || 


UND | die TÄter | solln NICHT mehr | so LEICHT wie bisHER | 
daVoNkommen | | 


DAS haben SICH | die LÄnder | im SICHerheitsrRAT | 
der verEINten naTIOnen | VORgenommen | | 


Bsp. 17: Meldung 4, Satz 6 bis 8; auffällig kleine Gliederungseinheiten 


Zusätzlich zu den kleinen Gliederungseinheiten wurden etliche artikulatorische 
Stauungen vermerkt (hier markiert mit '); auf 452 Gliederungseinheiten kommen 
121 Stauungen, wobei einige Sprecher*innen sogar mehrere Stauungen pro Glie- 
derungseinheit realisieren (siehe Beispiele 18 und 19). 


die eU SCHIFfe | haben IMmer WIEder | FLÜCHTlinge ' aus 
kaPUTten ' BOOten ' geRETtet || 


Bsp. 18: Meldung Sprecher 1, Satz 13; mehrere Stauungen in einer Gliederungseinheit 


DIE ' parTEI von ' reGIErungs ' CHEF | Sanchez | [...] 


Bsp. 19: Meldung 5, Satz 5; mehrere Stauungen in einer Gliederungseinheit 


Durchschnittlich umfassen die Gliederungseinheiten 6,8 Silben und dauern im 
Durchschnitt 1,94 Sekunden (siehe Tabelle 4). Die Gliederungseinheiten sind so- 
mit nicht mal halb so lang wie in konventionellen Nachrichten, z. B. im Vergleich 
zur Untersuchung von formatabhängigen Nachrichtensprechstilen: 17 Silben und 
3,09 Sekunden (vgl. Schwenke 2020, 239). Setzt man die durchschnittlichen Dau- 
erwerte ins Verhältnis, zeigt sich, dass die prosodischen Einheiten deutlich ver- 
zögert realisiert werden: Der auditive Eindruck des schleppenden Tempos wird 
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demnach nicht nur durch den reinen Anteil an Gliederungseinschnitten hervorge- 
rufen, sondern insbesondere durch die geringe Artikulationsgeschwindigkeit von 
3,4 Silben pro Sekunde (siehe Tabelle 3) (im Vergleich zu 5,4 Silben pro Sekunde 
bei Schwenke 2020, 250). 


Akzentuierung 
Meldung Silbenanzahl Akzentanzahl Akzentanzahl Akzentdichte 
(ges.) (ges.) ro GE in Silben 

M01 280 104 2,3 2,7 

M02 353 109 2,7 3,2 

M03 270 88 3,4 3,1 

M04 306 123 1,8 2,5 

M05 235 105 2,1 2,2 

M06 319 128 2,3 2,5 

M07 336 156 2,7 2,2 

M08 215 89 2,8 2,4 

M09 252 105 3,0 2,4 

M10 321 122 2,9 2,6 

Ø 288,7 112,9 2,6 2,6 


Tab. 5: Akzentanzahl (pro Meldung, pro GE) und Akzentdichte 


Neben dem Umfang der Gliederungs- bzw. Informationseinheiten kann die Ak- 
zenthäufigkeit als wichtigstes Kriterium verstanden werden, um hörverständliche 
und nicht-hörverständliche Sprechversionen voneinander zu unterscheiden (vgl. 
Bose et al. 2011, 50); in hörverständlichen Versionen ist z. B. jeweils nur ein Ak- 
zent pro Sprecheinheit vorgesehen (vgl. ebd., 46). In den analysierten nachrich- 
tenleicht-Meldungen kann dahingegen eine extreme Akzenthäufung beobachtet 
werden. Der Abstand zwischen den akzentuierten Silben beträgt bei allen Spre- 
cher*innen durchschnittlich 2,6 Silben. Das heißt, dass nahezu jede zweite bis 
dritte Silbe betont wird. Auch die Anzahl der Akzente pro Gliederungseinheit be- 
trägt durchschnittlich 2,6 Silben. Diese Häufung hat zur Folge, dass nicht nur die 
neue Information, sondern auch das bereits Bekannte prosodisch hervorgehoben 
wird. Die Hörer*innen bekommen keinen akustischen Hinweis, was die zentrale, 
neue Information ist. Ein Beispiel dafür ist das Beispiel 20: Bereits im ersten Teil- 
ausspruch folgen die Akzente Wort für Wort aufeinander. Ähnliches findet sich 
im Beispiel 21: In der Aufzählung wird jedes Objekt (hier: die einzelnen mensch- 
lichen Organe) in einer einzelnen Gliederungseinheit realisiert, obwohl die Auf- 
listung genauso im Satz vorher steht. 
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die MEISten MENschen DORT | SIND | buDDHISten || 
Bsp. 20: Meldung 9, Satz 18; Akzenthäufung 


DIEse orGAne | SETZen sie ' EInem KRANken EIN || 
bei DEM ' ZUM BEIspiel | 

das HERZ | 

die Lunge | 

Oder die LEber | 

NICHT MEHR ' RICHtig ' FUNKtioNIEren || 


Bsp. 21: Meldung 6, Satz 8; Akzentuierung bereits bekannter Informationen 


Die hohe Akzentdichte ist maßgeblich dafür verantwortlich, dass viele Meldun- 
gen eine eigentümliche Rhythmik aufweisen. Gravierender ist jedoch, dass die 
Regelmäßigkeit der Akzente an sehr vielen Stellen zu sinnwidrigen Hervorhebun- 
gen von Wörtern führt, u. U. sogar durch eine Akzentuierung der Artikel [einem, 
dem, zum] (siehe Beispiel 21). Mit der hohen Akzentdichte hängt die Akzenthäu- 
fung innerhalb von Wörtern zusammen, d. h. selbst innerhalb eines Wortes wer- 
den mehrere Akzente gesetzt. Dies kommt vor allem bei mehrsilbigen Wörtern ab 
drei Silben vor, z. B. werden in den beiden viersilbigen Worten [KRIEGSgeBIE- 
ten] und [SICHerheitsRAT] jeweils zwei Silben akzentuiert (siehe Beispiel 
22): 


DENN | es gibt KEIne FESten REgeln | UM | SEXuelle geWALT | 
in KRIEGSgeBIEten | zu beSTRaAfen | | 
EInige LÄnder | im SICHerheitsRAT | WOLIn SOLche REgeln ' NICHT || 


Bsp. 22: Meldung 4, Satz 10 und 11; Wörter mit mehreren akzentuierten Silben 


Besonders auffällig sind die Akzente in direkt aufeinanderfolgenden Silben, so- 
wohl in Sprecheinheiten als auch innerhalb von Wörtern. Dieser so genannte Ak- 
zentclash ist ungewöhnlich, weil sich akzentuierte Silben eigentlich von den Um- 
gebungssilben abheben sollen. Dieses Phänomen tritt im untersuchten Korpus 
mehrfach auf und wird mit dem Beispiel 23 illustriert: 


er HAT geSAGT | IN OSTDEUTSCHland | und WEST'DEUTSCHland | 
IST das LEben für VIEle MENschen ' NOCH NICHT GLEICH GUT || 


Bsp. 23: Meldung 10, Satz 14: Akzentclash wortübergreifend 


Die Akzentclashs innerhalb von Wörtern sind v. a. bei langen und schwierigen 
Wörtern zu beobachten, die in den Meldungen in der Regel erklärt werden (siehe 
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Beispiele 24 und 25). Möglicherweise gehen die Sprecher*innen davon aus, dass 
diese Wörter der Zielgruppe unbekannt sind, und sprechen sie deshalb Silbe für 
Silbe und mit überpräziser Artikulation. 


DANN ' beKOMMT man ElInen | 
orGANSPENdeAUSweis || 


Bsp. 24: Meldung 7, Satz 13; Akzentclash innerhalb eines Wortes 


die poliZEI SAGT | 
es waren MEHRere SELBSTMORDATtenTÄter | | 


Bsp. 25: Meldung 9, Satz 5; Akzentclash 


5 Zusammenfassung und Fazit 


Obwohl in der Senderselbstbezeichnung nicht explizit auf die Umsetzung der 
Leichten Sprache verwiesen wird, spiegeln die betrachteten Meldungen (insbe- 
sondere 1, 5 und 7) dennoch Merkmale der Leichten Sprache wider: Die Meldun- 
gen sind handlungsorientiert, sie sind aktivisch und im Verbalstil formuliert, No- 
minalisierungen gibt es nicht. Weiterhin werden der Konjunktiv und Genitiv- 
konstruktionen vermieden. In anderen Bereichen weisen die analysierten Meldun- 
gen jedoch weniger Leichte-Sprache-Merkmale auf: Es findet sich häufig mehr 
als eine Aussage innerhalb eines Satzes, es werden vermehrt reflexive Pronomina 
verwendet sowie Negationsformen. Außerdem sind die Meldungen nicht konse- 
quent linear aufgebaut, sondern wechseln zwischen vergangenem und dem aktu- 
ellen Geschehen. Der Wechsel der Zeitformen könnte mit dem Übersetzungspro- 
zess von konventionellen (Nachrichten-)Texten in sprachlich barrierefreie Texte 
zusammenhängen: Es ist zu vermuten, dass zunächst die Reihenfolge der Infor- 
mationen aus dem Originaltext übernommen wurde und dass im Anschluss zu- 
sätzliche Informationen ergänzt wurden, um der anvisierten Zielgruppe entspre- 
chende Erklärungen bieten zu können. Im Vergleich zu anderen Nachrichten- 
formaten unterscheiden sich die nachrichtenleicht-Meldungen gravierend: In 
konventionellen Nachrichten werden viel häufiger Nominalphrasen verwendet, 
der Anteil der einfachen Hauptsätze ist geringer und die Sätze sind länger sowie 
komplexer (vgl. dazu stellv. Kröninger 2009). 


Im Abgleich mit den sprechwissenschaftlichen Kriterien (vgl. Gutenberg 1994, 
Bose 2009, Bose et al. 2011) sind die Meldungstexte als hörverständlich zu be- 
werten — angesichts der kleinen Stichprobe unter Vorbehalt. Jedoch muss beachtet 
werden, dass die angelegten Analysekriterien sich von Formulierungsprinzipien 
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ableiten, die sich auf die hörverständliche Informationsvermittlung für ein breites 
Publikum ohne sprachlich-kognitive Beeinträchtigungen beziehen. Bezogen auf 
die spezifische Zielgruppe von nachrichtenleicht-Meldungen bzw. von barriere- 
freien Informationsangeboten stellt sich die Frage, ob die sprechwissenschaftli- 
chen Hörverständlichkeitskriterien strenger ausgelegt werden sollten oder ob wei- 
tere Kriterien hinzukommen müssten, um sie als barrierefrei hörverständlich 
einstufen zu können. Hier ließe sich an die Überlegungen zur Leichten Sprache 
anknüpfen: Bredel und Maaß (2016, 514) konstatieren, dass für die Formulierung 
in Leichter Sprache Strukturen der konzeptionellen Mündlichkeit verwendet wer- 
den (sollten), z. B. Adressiertheit, Vermeidung komplexer Nominalstrukturen, 
Bevorzugung des Perfekts vor Präteritum oder Verwendung von Satzreihen statt 
Satzgefügen. 

Geprüft werden muss, ob eine Übertragung von Regularien zur Formulierung 
barrierefreier Texte, z.B. der Leichte-Sprache-Regeln (Maaß 2015, Bre- 
del / Maaß 2016), auf gesprochensprachliche Settings oder audiovisuelle Medien 
ausreicht, um barrierefreies Verstehen von Radionachrichten zu ermöglichen. 
Denn bezogen auf die sprecherische Umsetzung sind die hier analysierten Mel- 
dungen nach sprechwissenschaftlichen Kriterien nicht durchgängig als hörver- 
ständlich zu bewerten. Auch wenn das Korpus mit zehn Aufnahmen nur eine 
kleine Stichprobe umfasst, lassen sich für eine erste Bestandsaufnahme Beson- 
derheiten in der Sprechweise der nachrichtenleicht-Meldungen zusammenfassen, 
welche den Hörverständlichkeitskriterien teilweise widersprechen: Alle Spre- 
cher*innen weisen ein deutlich verringertes Sprechtempo auf, v. a. durch den ho- 
hen Pausenzeitanteil von durchschnittlich 18 Prozent, aber auch durch die sehr 
niedrige Artikulationsgeschwindigkeit. Dies deckt sich mit dem auditiven Ein- 
druck, dass viele Sprecher*innen langsam und schleppend sprechen. Die prosodi- 
schen Einheiten sind überdurchschnittlich klein; teilweise umfassen sie nur Ein- 
zelwörter. Die Gliederungseinheiten stimmen dadurch häufig nicht mit der 
inhaltlichen Struktur überein. Diese Beobachtung deckt sich mit der von 
Schwenke et al. (2015) zu langsam gesprochenen Nachrichten der Deutschen 
Welle. Dazu kommt die auffällige Akzentuierung: Es werden extrem viele und 
oft besonders stark herausgestellte Akzente gesetzt; dies geschieht auf Wortebene, 
teilweise sogar auf Silbenebene. Die Herausstellung der Hauptinformation eines 
Ausspruches geht in der Regel verloren, da diese Überakzentuierung den Ein- 
druck erwecken könnte, dass alles wichtig sei. Für die abschließende Bewertung 
einer barrierefreien Hörverständlichkeit müssten Verstehens- und Wirkungstests 
mit der Zielgruppe zeigen, ob diese Art der sprecherischen Gestaltung den Be- 
dürfnissen kognitiv-sprachlich beeinträchtigter Menschen gerecht wird. 
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Beim Vorlesen der nachrichtenleicht-Meldungen und anderer barrierefrei formu- 
lierter Angebote werden Nachrichtensprecher*innen offensichtlich vor besondere 
Herausforderungen gestellt: Sie sollen erstens ihre „professionellen Reprodukti- 
onsfähigkeiten“ für Nachrichtentexte (Gutenberg 2002, 65), welche sie durch die 
routinierte Präsentation von komplexen Nachrichtentexten erworben haben, auf 
besonders einfach geschriebene — und damit eher unübliche bis untypische — 
Nachrichtenmeldungen übertragen. Zweitens sind sie aufgefordert, sich an den 
Bedürfnissen der Zielgruppe zu orientieren und dementsprechend langsam und 
überartikuliert vorzulesen. Dies führt zu einem Konflikt zwischen der gewohnten 
Umsetzung eines ritualisierten Nachrichtensprechstils (vgl. Schwenke 2020, 330- 
334) und der sprecherischen Anpassung an die anvisierten Rezipient*innen. Ähn- 
liche Ergebnisse lieferte eine Analyse von langsam gesprochenen Nachrichten der 
Deutschen Welle. Auch dort war die Sprechanweisung ‚langsam zu sprechen‘ 
verbunden mit erhöhter Eindringlichkeit und Veränderungen im Sprechfluss (vgl. 
Schwenke etal. 2015, 123-125). Damit erweitert die vorliegende Pilotuntersu- 
chung die Bandbreite der systematischen sprechwissenschaftlichen Radionach- 
richtenforschung um den Aspekt der Zielgruppenspezifik und stützt diesen gleich- 
ermaßen. Sie trägt außerdem zur Vertiefung der sprechwissenschaftlichen 
Auseinandersetzung mit der Hörverständlichkeit von Radionachrichten als Bei- 
spiel für informierendes Textsprechen bei und verweist auf den Ausbau eines ziel- 
gruppenspezifischen Hörverständlichkeitsbegriffs. 
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Verständlich, angemessen, zielgruppenorientiert: 
Schreiben und Sprechen von (Nachrichten-)Texten 
in Leichter Sprache 


Heiner Apel, Aachen / Ines Bose, Halle (Saale) / 
Anna Schwenke, Greifswald 


Barrierefrei aufbereitete Informationen werden seit einigen Jahren von mehreren 
Sendern des öffentlich-rechtlichen Rundfunks für Menschen angeboten, die auf- 
grund kognitiver oder sonstiger Einschränkungen von aktuellen Informationen 
ausgeschlossen bleiben würden. Bisher konzentrieren sich die Sender vor allem 
auf die Herstellung von Schrifttexten und orientieren sich an entsprechenden Re- 
gelwerken (z. B. Maaß 2015, Bredel / Maaß 2016a). Da diese barrierefreien Texte 
oft auch mündlich präsentiert werden, sollten Regeln zur sprecherischen Gestal- 
tung erarbeitet werden. Dazu können sprechwissenschaftliche Erkenntnisse bei- 
tragen, die auf empirischen Forschungen zum hörverständlichen Vorlesen beru- 
hen. Im Rahmen einer Wissenschafts-Praxis-Kooperation mit dem MDR werden 
zurzeit Standards für hörverständliche Nachrichtensendungen in Leichter Sprache 
erarbeitet und getestet. Im Folgenden werden wissenschaftlich basierte Regeln 
zum barrierefreien Vorlesen thesenartig präsentiert, aber auch offene Fragen for- 
muliert. Insofern bildet der Beitrag stärker als viele andere in diesem Band eine 
Brücke von wissenschaftsbasierten Analysen zur berufspraktischen Anwendung 
im Medienalltag. 


1 Hörverständliches Vorlesen: Empirische Forschung und 
berufliche Praxis 


Unser Alltag ist geprägt von Vorlese- und Zuhörsituationen unterschiedlichster 
Art. Kinder lauschen vorgelesenen Märchen und Kinderbüchern, bei vielen Er- 
wachsenen sind Hörbücher beliebt, in Festreden und Fachvorträgen werden ge- 
schriebene Texte mündlich vorgetragen. Ebenso wird in Fernsehen und Radio 
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vorgelesen: Redaktionell bearbeitete Manuskripte, z. B. für Beiträge oder Nach- 
richten, werden vor dem Mikrofon präsentiert. Auch Texte in Leichter Sprache 
werden für Menschen mit eingeschränkten Seh- bzw. Lesefähigkeiten immer häu- 
figer in vorgelesener Form angeboten. 

Für all diese verschiedenen Vorlesesituationen ist typisch, dass sie sich als Trias 
aus Text, Vorleser*in und Zuhörer*in darstellen lassen (vgl. Bose 2003, 56; 
Schwenke 2020, 124): Ein ausformulierter, niedergeschriebener Text mit be- 
stimmten sprachlichen Merkmalen wird beim Vorlesen mündlich realisiert und 
damit für einen oder mehrere Zuhörende hörbar gemacht. Die dafür verantwortli- 
chen sprecherisch-prosodischen Merkmale verweisen nicht nur auf den Modus 
Vorlesen an sich, sondern machen auch deutlich, welche Textsorte für welche 
Zielgruppe präsentiert wird. Aus diesem Gefüge lassen sich im rhetorischen Sinne 
bestimmte Vorgaben für die Vorlesetechnik ableiten. 


Für das Vorlesen eines Textes muss eine passende sprecherische Form gefunden 
werden, die für eine konkrete Situation, ein konkretes Publikum und ein bestimm- 
tes Textgenre angemessen ist (siehe Nieper in diesem Band). Oberstes Ziel ist, 
dass die Zuhörenden den Textinhalt schnell und problemlos erschließen können. 
Für die Vorleser*innen bedeutet dies, dass sie zuerst den Inhalt des vorliegenden 
Textes verstanden und ggf. interpretiert haben müssen, um ihn dann adäquat spre- 
cherisch umsetzen zu können. 

Der zugrunde liegende Text sollte so geschrieben sein, dass er sinnvermittelnd 
vorgelesen und optimal verstanden werden kann (vgl. Apel 2018). Hierfür haben 
sich — v. a. in Bezug auf das Vorlesen in den Medien bzw. auf das informierende 
Vorlesen von Sachtexten — spezifische Regeln entwickelt, die auf die sprachliche 
Gestalt des Textes abzielen und hörverständliches Vorlesen ermöglichen (d. h. 
„schreiben fürs Hören“; vgl. Wachtel 2009b; Schwiesau / Ohler 2016, 99ff.). 
Diese Regeln lassen sich empirisch gut belegen (vgl. z. B. Apel 2018, 355ff.) und 
können somit als eine Grundlage für die Produktion hörverständlicher Texte in 
Leichter Sprache dienen. 

Zuhörer*innen sollten den Inhalt während des Zuhörens beim Vorlesen sofort 
verstehen können. Denn sie können nicht nachfragen oder noch einmal zurück- 
blättern, wenn sie etwas nicht verstanden haben, z. B. beim Hören von Nachrich- 
ten im Hörfunk. Es kommt also darauf an, dass die Informationen in Hörtexten 
sprachlich und sprecherisch so aufbereitet werden, dass die Rezeptionsbarriere 
besonders niedrigschwellig ist. 

Im Grunde genommen zeichnet sich eine optimale Vorlesetechnik dadurch aus, 
dass der Text in (zusammenhängende) Sprecheinheiten gegliedert wird, dass 
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Textabschnitte und damit der Textaufbau durch den bewussten Einsatz prosodi- 
scher Mittel deutlich gemacht sowie die relevanten und neuen Informationen her- 
vorgehoben werden (vgl. Bose et al. 2011; Bose / Schwenke 2017; Apel 2018, 
359ff.). Grundvoraussetzung für die Umsetzung einer geeigneten Vorlesetechnik 
ist eine angemessene Sprechhaltung, welche einerseits die Voraussetzungen und 
Erwartungen der Zuhörenden berücksichtigt, andererseits jedoch auch die kon- 
krete Sprechsituation und das Textgenre kennzeichnet. Es sollte gewährleistet 
werden, dass die mündliche Präsentation von Inhalten hörverständlich erfolgt, 
aber gleichzeitig auch der typische Klang bzw. die Anmutung der vorgetragenen 
Textsorte (z. B. Märchenklang oder Nachrichtensound) hergestellt wird. Denn 
aufgrund der medialen Durchdringung der Alltagswelt (Thimm 2000, 49; 
Schwenke 2020, 78) kann davon ausgegangen werden, dass Hörer*innen über Er- 
kennungsmuster unterschiedlicher Textformen und Rezeptionssituationen verfü- 
gen, die sich im Zuge der medialen Sozialisation ausbilden und damit die Rezep- 
tion von vorgelesenen Texten prägen. 


Wie oben schon erwähnt, werden auch Texte in Leichter Sprache im Alltag häufig 
vorgelesen. So erstellen einige Rundfunksender zurzeit Nachrichten in Einfacher 
oder Leichter Sprache, deren Texte dann auf der Homepage der jeweiligen Insti- 
tution erscheinen, zum Teil versehen mit einer automatischen Computer-V orlese- 
funktion oder ergänzt durch Audiofassungen professioneller Sprecher*innen. Der 
MDR hat sich bewusst für den Einsatz von Leichter Sprache entschieden, für die 
ein Regelwerk existiert und mit der nach den Erfahrungen des Senders die anvi- 
sierten Zielgruppen besser zu erreichen sind (mündliche Auskunft der MDR-Re- 
daktion Barrierefreiheit / Telemedien). Der Sender bietet beispielsweise wochen- 
tags „Nachrichten in Leichter Sprache aus Mitteldeutschland“ an und wirbt dafür 
mit dem Slogan „Das Wichtigste aus Politik, Kultur, Wirtschaft und Sport. Aus 
Sachsen, Sachsen-Anhalt und Thüringen. [...] Für Menschen, die nicht so gut le- 
sen können.“ (Internetquelle 1). Dafür wählt die Redaktion zunächst aus dem ak- 
tuellen Nachrichtenprogramm eine Hauptnachrichtenmeldung sowie mehrere 
Kurzmeldungen aus Mitteldeutschland aus und bereitet sie vorläufig auf (z. B. 
durch Kürzung, Pointierung; mündliche Auskunft der Redaktion). Diese Meldun- 
gen werden dann an ein externes Übersetzungsbüro geschickt und dort gemäß den 
Regeln der Leichten Sprache umformuliert. Alle Meldungen werden einer Prüf- 
gruppe (Rezipient*innen mit kognitiven Einschränkungen) zur Abnahme vorge- 
legt. Anschließend werden diese Nachrichten im MDR von geschulten Spre- 
cher*innen eingesprochen. Außerdem werden die Meldungen in Leichter Sprache 
verlinkt mit den Ausgangsnachrichten in „schwerer Sprache“, so dass beide Ver- 
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sionen unmittelbar miteinander verglichen werden können. Die Verlinkung er- 
folgt auf Anregung der Nutzergruppe der funktionalen Analphabet*innen im Rah- 
men eines Usability-Tests 2019. Der MDR betont, dass es für ihn zum Standard 
gehört, dass seine barrierefreien Angebote regelmäßig durch die jeweiligen Nut- 
zergruppen getestet bzw. evaluiert werden und dass sich daraus im Bedarfsfall 
Änderungen, Ergänzungen usw. ableiten (mündliche Auskunft der Redaktion). 
Zurzeit werden die Meldungen in Leichter Sprache noch einzeln präsentiert, aber 
es ist ein Nachrichten-Podcast in Form einer regionalen Nachrichtensendung in 
Leichter Sprache in Planung. Sprechwissenschaftler*innen begleiten dieses Pro- 
jekt wissenschaftlich, sowohl theoretisch (z. B. mit der Erarbeitung von wissen- 
schaftlich basierten Regeln zum Sprechen von Nachrichten in Leichter Sprache) 
als auch praktisch (z. B. mit regelmäßigen Airchecks und Feedbacks); außerdem 
sind Master-Studierende der Sprechwissenschaft als Sprecher*innen der Nach- 
richten in Leichter Sprache beteiligt. 


Für das Vorlesen von Nachrichten in Leichter Sprache gelten die zu Beginn dieses 
Kapitels beschriebenen Gegebenheiten in gleicher Weise, allerdings ist es u. E. 
notwendig, besondere Bedingungen sowie speziell für diese Varietät und ihre 
Zielgruppe(n) angepasste Modalitäten anzunehmen und spezifische Regeln um- 
zusetzen. 


2 Leichte Sprache und Verständlichkeit als gesamtgesellschaft- 
liche Aufgabe 


Mit Bock (2019, 11) lässt sich festhalten: 


„ Leichte Sprache‘ ist mittlerweile fest in der Gesellschaft verankert. In nahezu allen 
Kommunikationsbereichen gibt es Texte unter dieser Bezeichnung. In einer relativ kurzen 
Zeitspanne hat es ‚Leichte Sprache‘ geschafft, sich als eine Form barrierefreier Kommu- 
nikation Bekanntheit zu verschaffen und sich zu etablieren.“. 


Auf der Website des MDR wird Leichte Sprache als „Konzept, das Texte stark 
vereinfacht“, bezeichnet (Internetquelle 2). Die Forschungsstelle Leichte Sprache 
an der Universität Hildesheim kennzeichnet Leichte Sprache als 


„Varietät des Deutschen, die im Bereich Satzbau und Wortschatz systematisch reduziert 
ist. Ebenso systematisch ist die Reduktion mit Bezug auf das Weltwissen, das für die 
Lektüre vorausgesetzt wird. Außerdem zeichnen sich Leichte-Sprache-Texte durch eine 
besondere Form der visuellen Aufbereitung aus“ (Maaß 2015, 11f.). 
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Leichte Sprache ist vorwiegend schriftsprachlich ausgeprägt und wird von keiner 
Sprechergemeinschaft getragen (vgl. ebd., 12). Es handelt sich um „eine geplante 
Varietät, keine spontan entstandene, die gemäß den Bedürfnissen einer bestimm- 
ten Adressatenschaft entwickelt wurde, die aber wiederum selbst überwiegend 
passive Rezipienten sind.“ (12). Das Ziel von Leichter Sprache besteht darin, 
„Kommunikation für Personenkreise verständlich zu machen und barrierefrei auf- 
zubereiten, die sonst von dieser Kommunikation ausgeschlossen wären“ (Bock 
2019, 13). Um die Zielgruppe(n) von Leichter Sprache konkreter zu fassen, kann 
Folgendes festgehalten werden: 


„Zum primären Adressatenkreis von Leichter Sprache zählen Menschen mit einge- 
schränkter Lesefähigkeit, die insbesondere durch geistige Behinderung, Lernschwierig- 
keiten, Demenz, prälinguale Hörschädigung bzw. Gehörlosigkeit, Aphasie oder funktio- 
nalen Analphabetismus hervorgerufen sein kann.“ (Bredel / Maaß 2016a, 10). 


Eine weitere potenzielle Gruppe bilden Personen, „die als Migranten nach 
Deutschland kommen und Deutsch als Zweitsprache ohne Unterweisung aus- 
schließlich in der kommunikativen Praxis erlernen.“ (Maaß 2015, 18). 


Für den Ausbau und die Weiterentwicklung der Leichte-Sprache-Forschung wer- 
den in jüngeren Publikationen (vgl. Bock 2019, Gros et al. 2020) insbesondere 
folgende drei Punkte hervorgehoben: 

Erstens die Abkehr von einer bloßen Befolgung der Leichte-Sprache-Regeln 
hin zu Angemessenheitsentscheidungen in Bezug auf den konkreten Text. Dabei 
bezieht sich Angemessenheit auf die Frage, was ein „guter Text“ sein könnte — 
mit der Antwort: „Ein guter Text ist möglichst leicht zu verstehen“ (Bock 2019, 
17). 

Zweitens die Forderung, die bisher beschriebenen Regeln der Leichten Sprache 
empirisch zu prüfen. Die Regeln sind zwar grundsätzlich wissenschaftlich fun- 
diert (vgl. z. B. Bredel / Maaß 2016b), aber noch gibt es keine ausreichend empi- 
risch gesicherten Wissensbestände. Darüber hinaus existiert ein starkes Span- 
nungsfeld zwischen einem etablierten Praxiskonzept einerseits (vgl. z. B. Bredel / 
Maaß 2016a) und einer erst entstehenden Forschungslandschaft andererseits (vgl. 
Bock et al. 2017). 

Drittens die Notwendigkeit, unterschiedliche Textsorten für die Leichte Spra- 
che zu erschließen (vgl. Bredel / Maaß 2016a, 27). Hier ist auch die Angemessen- 
heit eines vorliegenden Textes zu thematisieren. Die Frage danach, was einen (si- 
tuations- und hörerbezogenen) angemessenen Leichte-Sprache-Text ausmacht, 
kann eine sinnvolle Grundlage zur Erforschung vorgelesener Texte in Leichter 
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Sprache sein. Bock (2019, 17) formuliert fünf Angemessenheitsfaktoren, die „im 
Texterstellungsprozess zugleich als Orientierungsrahmen und praktische Prob- 
lemlösestrategie genutzt werden“ können. Die Angemessenheit eines Textes lässt 
sich somit dahingehend beschreiben, (1.) wie adressatenbezogen, (2.) funktional 
und kommunikationsbereichsbezogen, (3.) sachlich-inhaltlich der Text gestaltet 
ist; außerdem (4.) wie bezogen auf weitere situative Merkmale (mündliche und 
schriftliche Realisierung, Zeit und Ort etc.) er realisiert wird und schließlich (5.) 
wie senderbezogen der Text angelegt ist (ebd., 18). 


Diese fünf Angemessenheitsfaktoren können auch Anhaltspunkte für eine ver- 
ständliche Gestaltung von Nachrichten in Leichter Sprache sein und werden im 
Folgenden kurz erläutert: 


1. Für die Adressatenbezogenheit ist es relevant, die Ansprüche, Fähigkeiten 
und Bedürfnisse der Zielgruppe, die für das Anhören bzw. Zuhören von 
Nachrichten ausschlaggebend sind, zu identifizieren und zu berücksichti- 
gen. 

2. Das Herausstellen der Textfunktion ist wesentlich, damit Rezipient*innen 
erkennen können, wozu dieser Text dienen soll und was sie mit den Infor- 
mationen anfangen können. Als Leitfragen können z. B. formuliert werden: 
„Ist ein Nachrichtentext als sachlich-informierender Text gestaltet und ist 
Wahlwerbung als Kommunikationsform erkennbar, die nicht lediglich in- 
formieren will, sondern den Leser zu überzeugen versucht?“ (ebd.). 

3. Die inhaltliche Ausgestaltung, also ob der Gegenstand „so differenziert 
wie nötig und so einfach wie möglich“ (ebd.) besprochen wird, spielt na- 
türlich auch bei der Realisierung von Texten, die für das Hören geschrieben 
sind, und speziell bei Nachrichten in Leichter Sprache mit einem oft sehr 
informationsverdichteten Ausgangstext eine wichtige Rolle. 

4. Die situative Einbettung sowie die Bedingungen der medialen Realisie- 
rung sind insbesondere für das hörverständliche Vorlesen von Nachrichten 
in Leichter Sprache derzeit noch Desiderate. 

5. Die angemessene Gestaltung eines Hör-Textes ist bezogen auf einen be- 
stimmten Sender, also die Institution, die „den Text nach außen verantwor- 
tet“ (ebd.). Das ist relevant, um generell das Genre Nachrichten zu markie- 
ren sowie konkret die Formatierung des Senders, der die Nachrichten 
produziert (vgl. Schwenke 2020, 110ff.). Dies stellt für die Formulierung 
und Präsentation von Nachrichten in Leichter Sprache eine besondere Her- 
ausforderung dar, ist aber u. U. auch eine besondere Chance. Denn diese 
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Formatierung kann als advance organizer dienen und lässt damit die Texts- 
orte und -funktion klarer erkennbar werden (siehe Apel / Schwenke in die- 
sem Band). 


Basierend auf diesen Überlegungen werden wir uns in den folgenden Abschnitten 
mit der Frage beschäftigen, wie ein Text in Leichter Sprache möglichst verständ- 
lich vorgelesen werden kann. 


3 Regeln und Standards für hörverständliches Vorlesen von 
Texten in Leichter Sprache 


Für verständliche Texte in Leichter Sprache existieren Richtlinien und Regel- 
werke (vgl. stellvertretend den Überblick in Maaß 2015; Bredel / Maaß 2016b, 
82ff.), die sich auf Forschungen zu barrierefreier Sprache begründen und sich vor 
allem auf schriftliche Texte konzentrieren; geregelt werden bspw. die Syntax, die 
Lexik oder die Typografie der Texte. Differenzierte Empfehlungen, Vorgaben 
oder übergeordnete Standards (im Sinne journalistischer Stilnormen; Schwenke 
2020, 30) zum mündlichen Präsentieren dieser barrierefreien Texte gibt es bisher 
nicht. Sprechwissenschaftliche Untersuchungen belegen, dass Texte, die für das 
Vorlesen und Zuhören geschrieben werden, andere Verständlichkeitskriterien er- 
füllen müssen als Texte, die ausschließlich für die Leserezeption verfasst werden. 
Oberste Priorität hat dabei die Orientierung an den Wünschen und Bedürfnissen 
der angesprochenen Rezipient*innengruppe. 

Die nächsten untersuchungslogischen Schritte sind u. E. die Übertragung dieser 
Erkenntnisse auf Texte in Leichter Sprache sowie eine Prüfung sprechwissen- 
schaftlicher Hypothesen zum Zusammenhang von Text und Prosodie mit Einfluss 
auf die Verständlichkeit. Untersuchungen zur Aufbereitung nachrichtlicher In- 
halte für bestimmte Zielgruppen (vgl. Leuchte 2015, Schwenke et al. 2015; siehe 
auch Gerhardt / Schwenke in diesem Band) verweisen für die sprecherischen Prä- 
sentation auf jeweils besondere Anforderungen. Diese Erkenntnisse sowie die Er- 
fahrungen aus der Wissenschafts-Praxis-Kooperation mit dem MDR zum Spre- 
chen von Nachrichten in Leichter Sprache legen den Schluss nahe, dass das 
Vorlesen von Leichte-Sprache-Texten einer besonderen Sprechtechnik bedarf. 
Eine Grundlage dafür bieten sprechwissenschaftliche Auffassungen zur Theorie 
und Didaktik des Vorlesens (vgl. z. B. Gutenberg 1998, Ockel 2000), Forschun- 
gen zur Prosodie (vgl. u. a. Stock 1996a und 1996b, Neuber 2002) sowie zur Hör- 
verständlichkeit und zum Sprechstil von Radionachrichten (vgl. Bose / Schwiesau 
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2011, Bose 2015, Apel 2018 sowie Schwenke 2020). Bevor konkrete Vorlesere- 
geln formuliert werden können, geht es aber zunächst darum, Beurteilungskrite- 
rien für hörverständliche Texte in Leichter Sprache zu entwickeln. Dies wird im 
Folgenden am Beispiel von Nachrichten erarbeitet. 


3.1 Nachrichtentexte in Leichter Sprache: konsequent gerahmt, 
systematisch und mit erkennbarem Ziel 


Für die selbstbestimmte gesellschaftliche Teilhabe spielen barrierefreie und hör- 
verständliche (Radio-)Nachrichten eine wesentliche Rolle (siehe Gerhardt / 
Schwenke in diesem Band). Die Produktion von Nachrichten in Leichter Sprache 
orientiert sich grundsätzlich an der üblichen redaktionellen Arbeit in den Nach- 
richtenredaktionen: Aus zahlreichen Agenturmeldungen werden die wichtigsten 
Themen des Tages ausgewählt und zu Nachrichtenmeldungen umformuliert. Da 
Radionachrichten viele Informationen in kurzer Zeit bringen, sind sie idealer- 
weise allgemeinverständlich, wertungsfrei, alltagstauglich und sprachlich korrekt 
formuliert. Die Umsetzung dieser Idealvorstellungen sichern journalistische Stan- 
dards des hörverständlichen Schreibens, die in Anforderungskatalogen journalis- 
tischer Ratgeber systemisch erfasst sind (vgl. stellvertretend La Roche / Buchholz 
2004, Schwiesau / Ohler 2016), auf einem allgemeinen Konsens beruhen und eine 
gewisse Verbindlichkeit im Sinne beruflicher Anforderungen beanspruchen. In 
der Aus- und Weiterbildung von Radiojournalist*innen bzw. Redakteur*innen 
werden sie reproduziert und tradiert (vgl. Apel/ Schwenke 2011, 178 ff.). Im kon- 
kreten Schreibprozess lassen sich die journalistischen Standards des hörverständ- 
lichen Schreibens insbesondere auf folgende Gestaltungsbereiche beziehen: 


- Textaufbau und Informationsstruktur 

-  Informationsdichte und Komplexität von Wörtern und Sätzen 
- Satzverknüpfungen 

- Verwendung von Synonymen und generelle Wortwahl 


Praktische Empfehlungen zur Nachrichtenpräsentation (vgl. Bose / Schwenke 
2017), empirisch belegt durch Forschungen zur Hörverständlichkeit von Radio- 
nachrichten (vgl. Apel 2018), geben an, dass in hörverständlich geschriebenen 
Nachrichtensätzen bekannte Informationen möglichst vor neuen Informationen 
im Satz platziert werden sollten (stark vereinfacht: Thema vor Rhema). Da im 
ersten Satz, dem Leadsatz, zunächst alle Informationen neu sind (das Thema muss 


226 © Frank & Timme Verlag für wissenschaftliche Literatur 


erst einmal etabliert werden), sollten hier Inhalte, die vermutlich stärker im Welt- 
wissen der Rezipient*innen präsent sind, vor gänzlich neuen Inhalten stehen (vgl. 
für eine differenzierte Unterscheidung Prince 1981; Musan 2010, 4ff.). Da neue 
Informationen beim Vorlesen üblicherweise akzentuiert werden, trägt so — bei ei- 
ner informationsstrukturellen Gestaltung mit den gänzlich neuen Informationen 
am Satzende — die Information mit dem größten Neuigkeitswert den Satzakzent. 
Das erhöht die Verständlichkeit eines Satzes nachweislich (vgl. Apel 2018, 
359ff.). Die Hörverständlichkeit von Nachrichtentexten wird außerdem durch die 
Reduktion von Informationsdichte und Satzkomplexität erhöht, also durch das 
Vermeiden von Nominalisierungen, überspezifizierten Ausdrücken, ausgedehn- 
ten Adverbial- und Nominalphrasen, von Mehrfachattribuierungen durch Präpo- 
sitionalphrasen sowie Inhaltskomprimierung in mehrteiligen Satzgefügen (vgl. 
Göpferich 2006, 163ff. und 176ff.; Apel 2018, 358f.). 


Diese grundlegenden Standards decken sich in weiten Teilen mit den Regeln zum 
Schreiben in Leichter Sprache — auch hier geht es darum, Komplexität zu vermei- 
den und so Lesetexte verständlicher zu gestalten. Dabei kann auf eine lange Tra- 
dition der Forschung und Konzeptualisierung von Leseverständlichkeit zurückge- 
griffen werden (vgl. Groeben 1982; Lutz 2015 sowie den Überblick in Bredel / 
Maaß 2016b, 117ff.). Übersichtlich zeigt Bock (2019, 25), wie einfach(er)es 
Schreiben ermöglicht werden kann; dabei geht es bspw. darum, in Texten an- 
schaulich und konkret zu sein, Unbekanntes mit bekannten Wörtern zu erläutern 
sowie inhaltliche Zusammenhänge und Bezugnahmen deutlich zu machen (vgl. 
ebd.). 


Die Standards zum hörverständlichen Schreiben von Nachrichten einerseits und 
die Regeln zum Schreiben in Leichter Sprache andererseits lassen sich zu Emp- 
fehlungen zum Schreiben fürs Vorlesen in Leichter Sprache zusammenfüh- 
ren, die sich auf Anlage und Gesamtaufbau sowie Satz- und Wortebene des Textes 
beziehen: 


1. Textsorte nennen: Erkennen die Zuhörer*innen die Textsorte, werden 
mentale Rezeptionsgewohnheiten und -routinen sowie der Kontext und der 
Zweck eines Textes aufgerufen und können somit das Verstehen erleichtern 
(vgl. Bock 2019, 68f.). Für eine Radionachrichtensendung stellt vermutlich 
schon das Schlagwort „Nachrichten“ oder „Nachrichten vom Dienstag, 
dem 20. Juli 2021“ den passenden Kontext her. Auf der MDR-Website (In- 
ternetquelle 1) wird das Angebot in Leichter Sprache folgendermaßen über- 
schrieben: „Nachrichten in Leichter Sprache aus Mittel-Deutschland. Das 
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Wichtigste aus Politik, Kultur, Wirtschaft und Sport. Aus Sachsen, Sach- 
sen-Anhalt und Thüringen. Montag bis Freitag, 13 Uhr, außer an Feierta- 
gen. Für Menschen, die nicht so gut lesen können.“ Damit wird klar ge- 
macht, dass es sich bei allen Beiträgen auf dieser Seite um Nachrichten mit 
der entsprechenden Textsortenkonvention handelt. 


. Textfunktion benennen und (er)klären: Eine Information darüber, wozu 


die Nachrichten dienen, erleichtert ebenfalls das Verstehen. Bei klassischen 
Nachrichten wird der Nachrichtenwert unterteilt in den Neuigkeitswert 
(Was ist aktuell passiert?) und in den Informationswert (Was kann ich mit 
dieser neuen Information anfangen?) (vgl. Schwiesau / Ohler 2016, 19). 
Der Informationswert kann noch einmal unterschieden werden in Wissens- 
und Orientierungswert (Betroffenheit, Tragweite, Nähe), Gebrauchswert 
(Schaden, Nutzen) und Gesprächs- und Unterhaltungswert (Menschen, 
Emotionen, Spannung, Außergewöhnliches) (ebd.). Während in klassi- 
schen Nachrichten diese Nachrichtenwerte selten explizit gemacht werden, 
kann es für Nachrichten in Leichter Sprache verständnisfördernd sein zu 
erwähnen, was die Rezipient*innen nun mit der Nachricht anfangen können 
(z. B. sich selbst engagieren, eine neue Funktion nutzen, vorsichtig sein 
usw.). 


Zuhörsituation beim Schreiben bewusst machen und beachten: Die 
Nachrichten können nicht „vor- oder zurückgehört“ werden (bzw. nur mit 
höherem Aufwand), daher sollte textstrukturell immer so geschrieben wer- 
den, dass das benötigte Vorwissen zum Verstehen eines Textes an den je- 
weils notwendigen Stellen bereitgestellt (und nicht erst im Nachhinein er- 
wähnt) wird. Vergleichbar ist dies dem Andockmodell zum Aufbau von 
Nachrichtenmeldungen (vgl. Kropf 2011), bei dem zunächst situiert wird, 
d. h. einleitende Informationen gegeben werden, bevor der Leadsatz bzw. 
der Meldungskern benannt wird. 


(Schlagzeile auf der Website angegeben - nicht vorgelesen) 
Die Gewerkschaft IG Metall macht Warn-Streiks 


Im Bundes-Land Sachsen-Anhalt 
gibt es heute Warn-Streiks. 
Die Mitarbeiter von einigen Firmen gehen heute nicht zu ihrer 
Arbeit. 
Zum Beispiel in den Städten: 
« Halberstadt, 
e Schönebeck 
e und Nachterstedt. 
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IG Metall ist eine große Gewerkschaft. 

Sie macht sich für die Rechte von den Arbeit-Nehmern stark. 
Zum Beispiel: 

Damit die Arbeit-Nehmer mehr Urlaub bekommen. 


Die IG Metall macht jetzt eine Tarif-Verhandlung 

mit den Chefs von den Firmen. 

Die IG Metall will: 

Dass die Arbeit-Nehmer mehr Geld für ihre Arbeit bekommen. 


Aber die Chefs von den Firmen wollen das nicht. 
Die Chefs denken: 
Dass sie wegen der Corona-Krise nicht mehr Geld geben können. 


Deshalb hat die IG Metall zu den Arbeit-Nehmern gesagt: 


wir machen einen Warn-Streik. 


Bsp. 1: MDR Nachricht in Leichter Sprache vom 02.03.2021 


Im Beispiel 1 zeigen sich beide Ausprägungen: Der Terminus bzw. die 
Neuigkeit „Warnstreiks“ zu Beginn der Nachricht wird erst im Nachhinein 
erläutert — dies entspricht eher dem klassischen pyramidalen Nachrichten- 
modell (Schwiesau / Ohler 2016, 33ff.). Die Anbindung der Erläuterung ist 
jedoch so eng mit dem erläuterten Terminus verknüpft, dass u. E. die Ver- 
ständlichkeit gut gewährleistet ist. Dagegen wird später im Satz „IG Metall 
ist eine große Gewerkschaft" zunächst die IG Metall vorgestellt und erst 
danach folgt die Hinführung zur eigentlichen Nachricht der Tarifverhand- 
lungen, die ebenfalls beispielhaft erläutert werden. Erst am Ende wird der 
Fakt der „Warnstreiks“ benannt. D. h. hier wird das benötigte Vorwissen 
dafür, wie Tarifverhandlungen ablaufen, zunächst dargestellt, was ebenfalls 
verständlichkeitsfördernd wirkt. 


4. Textglobale Rahmungen und Zusammenfassungen verwenden: Ein 
Themenüberblick zu Beginn kann als advance organizer notwendige men- 
tale Repräsentationen aufrufen und damit die Wiedererkennbarkeit beim 
Hören erhöhen; eine Themenzusammenfassung am Ende der Nachrichten 
kann das Gehörte sichern. Im Beispiel 2 wird durch die Schlagzeile / Über- 
schrift und den Überblick, welche Themen behandelt werden, ein klassi- 
scher advance organizer bereitgestellt, der das Verstehen des im Anschluss 
Vorgelesenen leitet. Allerdings werden Schlagzeile und Überblick nicht ge- 
sprochen; anzuregen ist, solche Textstrukturierungshinweise auch in die 
Sprech- bzw. Vorlesefassung zu übernehmen. 
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(Schlagzeile und Themenüberblick auf der Website angegeben - nicht vorgelesen) 


Die neuen Corona-Regeln für Sachsen-Anhalt 


Auf dieser Seite: 
e Treffen in Gruppen 
e Die Corona-Regeln für die Schulen 
e Urlaub und Reisen 
e Gaststätten 
e Geschäfte 


(ab hier vorgelesen:) 


In vielen Bundes-Ländern in Deutschland 

haben nur noch wenige Menschen das Corona-Virus. 
Das ist auch im Bundes-Land Sachsen-Anhalt so. 
Dort gibt es viele Land-Kreise: 

wo die Corona-Regeln jetzt gelockert werden. 

Das wird seit dem 2. Juni gemacht. 

Das sind ab jetzt die neuen Corona-Regeln 

für die Land-Kreise in Sachsen-Anhalt: 


C) 
Bsp. 2: MDR Nachricht in Leichter Sprache vom 04.06.2021 


Gliederung explizit machen und Verweise herstellen: In einer Nachrich- 
ten-sendung sollte immer wieder deutlich gemacht werden, an welcher 
Stelle der Nachrichten sich die Zuhörer*innen befinden; z. B. „Wir kom- 
men jetzt zur dritten Meldung. Es geht um das Thema [Thema].“ oder 
„Eben haben wir uns mit [Thema] beschäftigt. Jetzt geht es um etwas ganz 
Anderes.“. Bislang werden die Nachrichtenmeldungen des MDR in Leich- 
ter Sprache (Text und Audio) jeweils einzeln auf der Website angeboten, 
insofern sind solche Gliederungsmerkmale noch nicht relevant. Wichtig 
kann das insbesondere in einem (noch in der Planung befindlichen) Podcast 
werden, der mehrere Meldungen zu einer Nachrichtensendung zusammen- 
fasst und demzufolge eine größere Aufmerksamkeitsspanne erfordert. 


Satzkomplexität reduzieren: Durch das Reduzieren der Regressivität von 
Konstruktionen (vgl. Göpferich 2006, 180f.) lassen sich ausgedehnte Span- 
nungsbögen vermeiden, die das Hörverstehen erschweren. Im Beispiel 3 
befindet sich das Verb in der Satzendstellung, so dass eine große Verbklam- 
mer entsteht, die beim Hören eine lange Aufmerksamkeitsspanne erfordert. 


(Schlagzeile auf der Website angeben - nicht vorgelesen) 


Das sind die neuen Corona-Regeln bis zum 28. März für ganz 
Deutschland 

[0) 

Es gibt einige Regeln, 

die sich ab nächster Woche verändern. 
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Zum Beispiel: 

e Blumen-Läden, 

e Buch-Geschäfte 

e und Garten-Märkte 
dürfen wieder auf-machen. 


Bsp. 3: MDR Nachricht in Leichter Sprache vom 05.03.2021 


Wird das Verb dagegen aus der Satzendstellung ins Hauptfeld gezogen 
(Beispiel 4, Neuformulierung kursiv), verringert sich die erforderliche Auf- 
merksamkeitsspanne beim Hören deutlich. Zudem vereinfacht sich die 
sprecherische Realisation aufgrund des kürzeren Spannungsbogens. 


Es gibt einige Regeln, 
die sich ab nächster Woche verändern. 
Einige Orte dürfen wieder auf-machen. 
Zum Beispiel: 

e Blumen-Läden, 

« Buch-Geschäfte, 

e und Garten-Märkte. 


Bsp. 4: Neuformulierung von Beispiel 3 mit geringerer Regressivität 


7. Auf Satzebene bekannte Informationen vor neuen Informationen an- 
ordnen: Konsequent sollten zunächst bekannte Informationen (z. B. aus 
dem bereits Genannten) angeführt werden und erst danach neue Informati- 
onen, um beim Sprechen den Satzakzent auf das Neue und damit das We- 
sentliche legen zu können. Im Beispiel 5 werden v. a. im ersten Abschnitt 
die jeweils neuen und relevanten Informationseinheiten („Unwetter“, 
„Hochwasser“, „Erdrutsche“, „Menschen gestorben“) konsequent nach be- 
reits bekannten Informationen gegeben. Wie die Vorlesefassung der Nach- 
richt (Audio 1; siehe auch das Transkript 1 in 3.2) zeigt, kann damit die 
Textebene auch die Akzentgestaltung beim Vorlesen anbahnen. Das Audio 
ist verfügbar über den QR-Code zu Beginn des Artikels bzw. unter: 

https://cloud.uni-halle.de/s/bg7pZ9rpPsawhDj. 


(Schlagzeile auf der Website angegeben - nicht vorgelesen) 


In Mittel-Deutschland soll es mehr Sirenen geben 


In einigen Bundes-Ländern in Deutschland gab es schlimme 
Unwetter. 
Dort hatten die Flüsse Hochwasser. 
Und es gab Erdrutsche. 
In dem Unwetter sind einige Menschen gestorben. 
Und Sachen sind kaputt gegangen. 
Zum Beispiel: 
e Straßen 
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« Und die Häuser von den Menschen. 
(..) 
Jetzt sprechen die Menschen darüber: 
Dass es bessere Warn-Systeme in Deutschland geben muss. 
Damit sollen die Menschen gewarnt werden: 
Wenn etwas Gefährliches passiert. 
Zum Beispiel: 
e Wenn es eine Natur-Katastrophe gibt. 
« Wenn es eine Umwelt-Katastrophe gibt. 
e Oder wenn es einen großen Brand gibt. 
6) 


Bsp. 5: MDR Nachricht in Leichter Sprache vom 21.07.2021 (Audio 1) 


Im Beispiel 6 wird eine Neuformulierung vorgeschlagen, in der die be- 
kannte Information (‚in Deutschland“) vor die neue Information („bessere 
Warnsysteme“) gesetzt wird und somit das Prinzip „Thema vor Rhema“ 
weiterhin konsequent umgesetzt wird. Zusätzlich wird so die sprecherische 
Akzentuierung von „Warnsysteme“ als neue Information forciert. 


Jetzt sprechen die Menschen darüber: 

Dass es in Deutschland bessere Warn-Systeme geben muss. 
Damit sollen die Menschen gewarnt werden: 

Wenn etwas Gefährliches passiert. 


Bsp. 6: Neuformulierung von Beispiel 5 mit Thema vor Rhema 


8. Durch systematische Wiederholungen die Wiederaufnahme von Inhal- 
ten erkennbar gestalten: Es sollte systematisch Redundanz erzeugt wer- 
den, z. B. durch Wiederholung eingeführter Begriffe und Vermeidung von 
Synonymen. Dies entspricht den allgemeinen Regeln zum Schreiben Leich- 
ter Sprache-Texte und ist besonders wichtig beim Schreiben von Lesetex- 
ten, die u. U. ausschließlich auditiv rezipiert werden. Im Beispiel 7 wird 
konsequent der Terminus „Schloss“ wiederholt. 


(Schlagzeile auf der Website angegeben - nicht vorgelesen) 
In Köthen wird viel am Schloss neu gemacht 


Die Stadt Köthen ist in dem Bundes-Land: Sachsen-Anhalt. 
Dort gibt es ein altes Schloss. 

An dem Schloss sollen jetzt viele Sachen neu gemacht werden. 
In schwerer Sprache heißt das: Das Schloss wird saniert. 

(=) 

Die Kultur-Stiftung gibt viel Geld: 

Damit das Schloss saniert werden kann. 


Bsp. 7: MDR Nachricht in Leichter Sprache vom 30.07.2021 
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9. Zwischenüberschriften bei langen Aufzählungen setzen: Sinnvoll ist die 
Unterbrechung von langen Aufzählungen durch wiederholte (wörtlich glei- 
che) Zwischenüberschriften, die auch als advance organizer zu verstehen 
sind (siehe Punkt 4). Wie das Beispiel 8 zeigt, wird im Schriftsatz bei län- 
geren Aufzählungen die gewünschte Übersichtlichkeit durch die unterei- 
nanderstehende Anordnung und Markierung durch Spiegelstriche (hier 
Aufzählungspunkte) durchaus erreicht. 


Im Bundes-Land Sachsen-Anhalt gibt es neue Corona-Regeln 


Seit Mittwoch gibt es im Bundes-Land Sachsen-Anhalt 
neue Corona-Regeln. 
Für einige Freizeit-Angebote brauchen die Menschen 
jetzt keinen Corona-Test mehr. 
Zum Beispiel: 

« Im Freibad, 

« im Museum, 

e bei Gedenkstätten, 

« in Ausstellungen, 

« in Bücherei-en 

« oder in Auto-Kinos. 


(e) 
Bsp. 8: MDR Nachricht in Leichter Sprache vom 16.07.2021 


Jedoch geht diese visuelle Übersichtlichkeit beim Sprechen nahezu gänz- 
lich verloren, z. B. weil zahlreiche Pausen und die schwebende Endmelodie 
am Ende jedes Aufzählungspunkts den Ausspruchzusammenhang nicht 
mehr erkennen lassen. Deshalb sollten lange Aufzählungsketten vermieden 
bzw. durch das Einfügen von redundanten oder erläuternden Zwischen- 
überschriften verkürzt werden, wenn die Nachrichten in erster Linie auditiv 
rezipiert werden sollen (siehe den Vorschlag in Beispiel 9; Neuformulie- 
rung kursiv). 


Für einige Freizeit-Angebote brauchen die Menschen 
jetzt keinen Corona-Test mehr. 
zum Beispiel: 
« Im Freibad, 
« im Museum, 
e bei Gedenkstätten, 
Auch hier brauchen die Menschen jetzt keinen Corona-Test mehr: 
« in Ausstellungen, 
« in Bücherei-en 
e oder in Auto-Kinos. 


Bsp. 9: Neuformulierung von Beispiel 8 mit Zwischenüberschrift 
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Diese hier vorgestellten Überlegungen zum Schreiben fürs Hören von Leichter 
Sprache beziehen sich auf die textuellen Aspekte, welche die auditive Rezeption 
geschriebener Texte betreffen und erleichtern sollen. In Abschnitt 3.2 geht es dar- 
über hinaus um die verständnissichernde sprecherische Gestaltung von Nachrich- 
tentexten in Leichter Sprache. 


3.2 Hörverständliches Vorlesen von Nachrichtentexten in Leichter 
Sprache: langsam, klar gegliedert, deutlich akzentuiert 


Generell sind für die Hörverständlichkeit von vorgelesenen (Nachrichten-)Texten 
folgende Aspekte ausschlaggebend: eine moderate Sprechgeschwindigkeit, deut- 
liche Gliederungseinschnitte sowie die Akzentuierung der neuen, unbekannten In- 
formationen bzw. des Satzfokus. Zuhörer*innen brauchen diese prosodischen 
Hinweise, um die Informationen aufzunehmen, zu verarbeiten und zu verstehen. 
Beim Vorlesen wird die Stimme zur Inhaltsvermittlung genutzt, um z. B. Texte 
zu gliedern und wichtige Wörter hervorzuheben. Darüber hinaus ist die Stimme 
aber immer auch Ausdruck der Vorlese-Persönlichkeit und zeigt deren (emotio- 
nale oder persönliche) Haltung zum Text und zur Situation an (vgl. Neuber 2002); 
dies geschieht durch die Kombination verschiedener prosodischer bzw. stimm- 
lich-artikulatorischer Merkmale (vgl. Bose 2001 und 2010): 


-  Stimmlage (tief / hoch) 

-  Stimmklang (weich / hart, rau / behaucht / knarrend / klar, klangvoll / klang- 
arm) 

- Lautheit (leise / laut) 

- Melodieführung (bewegt / monoton, großer / Kleiner Melodieumfang), 

- Sprechspannung (gering / stark gespannt) 

- Sprechtempo (langsam / schnell) 

- Sprechpausen (häufig / selten, kurz / lang) 

-  Aussprachebesonderheiten (undeutlich / präzise) 


Als Grundlage für hörverständliches Vorlesen kann zudem die typografische Ge- 
staltung der Vorlese-Texte in Leichter Sprache dienen, indem sie den Spre- 
cher*innen Hinweise auf die Realisierung der Textgrundlage gibt. D. h. durch die 
charakteristische Typografie von Leichte Sprache-Texten (meist sehr kleine Text- 
abschnitte in einer Zeile) wird der Text vorstrukturiert und die Sprechgliederung 
angebahnt — sie kann von den Sprecher*innen als Sprechanweisung genutzt wer- 
den; siehe die Meldung ‚In Mittel-Deutschland soll es mehr Sirenen geben“ vom 
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21.07.2021 (Nachrichtentext im Beispiel 5 und Transkript der Vorlesefassung im 
Beispiel 10). Zudem könnte im Vorlese-Manuskript Fettdruck eingesetzt werden, 
um auch Akzentstellen für die Sprecher*innen zu markieren, und zwar so, dass 
bspw. koreferenzielle Bezüge (anaphorisch oder kataphorisch) sowie Fokusak- 
zente (z. B. bei der Verschiebung des normalen Satzakzents auf einen Kontrastak- 
zent) sicht- und damit hörbar werden. Die Typografie kann somit die Schnittstelle 
sein, mit der schriftliche Gliederungs- und Hervorhebungssignale ins Mündliche 
übertragen werden (vgl. z. B. Apel et al. 2020 zur Funktion von Anführungszei- 
chen für die prosodische Herausstellung von Wörtern). 


Im Folgenden werden Gestaltungshinweise für die eingangs genannten grundle- 
genden sprecherischen Merkmale erläutert. 


Sprechgeschwindigkeit 

Für das Vorlesen in Leichter Sprache eignet sich eine moderate Sprechgeschwin- 
digkeit. Es sollte nicht zu langsam vorgelesen werden, um die Aufmerksamkeit 
der Zuhörer*innen nicht zu verlieren und das Format Radio-Nachrichten nicht zu 
verlassen. Es sollte jedoch auch nicht zu schnell vorgelesen werden, um keine 
Informationsverdichtung durch zu viele Informationen in kurzer Zeit zu generie- 
ren. Je nach inhaltlicher Wichtigkeit und Neuigkeit einer Information sollte die 
Sprechgeschwindigkeit variiert werden: Neue Informationen sollten langsamer 
(sowie lauter und präziser) gesprochen werden, bereits bekannte Informationen 
können schneller (sowie leiser) gesprochen werden (vgl. Bose et al. 2011, Wach- 
tel 2009a). 

Die Rückmeldung der Sprecher*innen der Leichte-Sprache-Nachrichten im 
Rahmen eines MDR-Feedbacks zeigt, dass die Anpassung der Sprechgeschwin- 
digkeit nicht ganz einfach ist und sich im Spannungsfeld von Genretreue und Ver- 
ständlichkeit bewegt, wobei das sehr langsame Sprechen den Bezug zur Textsorte 
Nachrichten erschwert. Hier sind Wirkungsuntersuchungen notwendig, um Richt- 
werte für eine optimale Sprechgeschwindigkeit für Nachrichten in Leichter Spra- 
che zu ermitteln. 


Sprechgliederung 

Mittels Sprechmelodie (sowie Sprechspannung) und Gliederungssignalen (z. B. 
Pausen) werden Gruppen von Wörtern zu Sprecheinheiten zusammengefasst. An 
diesen sprecherisch klar abgegrenzten Informationseinheiten können sich Zuhö- 
rer*innen orientieren. Eine solche gesprochene Informationseinheit sollte proso- 
disch, syntaktisch und semantisch kongruent gestaltet sein. 
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Mittels des Melodieverlaufs kann eine Sprecheinheit als prosodisch abgeschlos- 
sen oder nicht abgeschlossen gekennzeichnet werden. Entscheidend dafür ist die 
Markierung und Wahrnehmung der Endmelodie, also des Melodieverlaufs von 
der letzten Akzentsilbe bis zum Ende einer Sprecheinheit. Im Deutschen können 
drei charakteristische Verlaufsformen unterschieden werden: Abgeschlossenheit 
durch stark fallende Endmelodie bis an die untere Grenze des individuellen 
Sprechstimmumfangs (sog. Lösungstiefe), Abgeschlossenheit durch stark stei- 
gende Endmelodie und Nichtabgeschlossenheit durch schwebende (leicht stei- 
gende, leicht fallende oder gleichbleibende) Endmelodie (vgl. Stock 1996a und 
19966). 

Die stark fallende Endmelodie (mit starker Verringerung von Sprechspannung, 
Lautheit und Sprechtempo) ist typisch für vorgelesene Radionachrichten und wird 
realisiert, um vollständige und inhaltlich abgeschlossene Sprecheinheiten (bei 
Nachrichten i. d. R. beendete Sätze) zu kennzeichnen. Beim Vorlesen von Texten 
in Leichter Sprache stellt dieses Mittel eine Möglichkeit dar, um die Abgeschlos- 
senheit und damit die Zusammengehörigkeit von Informationen bzw. Informati- 
onseinheiten zu markieren. Die steigende Endmelodie wird gelegentlich genutzt, 
um Ortsmarken oder Schlagzeilen bei freundlich-kontaktinteressierter Haltung zu 
markieren. Mit schwebender Endmelodie werden Satzteile beendet, die eine 
wichtige neue Information enthalten, aber inhaltlich noch nicht abgeschlossen 
sind bzw. erst im Folgesatz abgeschlossen werden (vgl. Stock 1996a und 1996b). 
Hier sollte den Vorleser*innen von Nachrichten in Leichter Sprache klar sein, 
welche Form der Endmelodie sie aufgrund der Textgrundlage realisieren müssen 
(ggf. durch eine entsprechende Markierung im Text), um das adäquate und pas- 
sende Gliederungssignal zu übermitteln. Letztendlich erleichtert eine inhaltlich 
motivierte und sinnvermittelnde Sprechgliederung in abgeschlossene und nicht- 
abgeschlossene Sprecheinheiten den Hörer*innen das Verstehen von Lesetexten. 


Hörbare akustisch messbare Einschnitte im Sprechfluss (Sprechpausen) entste- 
hen durch die Rhythmisierungsgewohnheiten im Deutschen und / oder durch die 
Notwendigkeit des Einatmens beim Sprechen (Atempausen). Sie können aber 
auch bewusst eingesetzt werden, um abgeschlossene und nichtabgeschlossene 
Sprecheinheiten voneinander abzugrenzen. Neben den Sprechpausen können 
auch phonetische Kontraste zwischen den Sprecheinheiten als Gliederungssig- 
nale wirken, z. B. Melodiekontraste (tief / hoch), Lautheitskontraste (laut / leise), 
Sprechspannungskontraste (gering / stark) oder Lautdauerkontraste (Dehnungen / 
Kürzungen). Für den Prozess des Vorlesens ist es wichtig, dass sich die Sprech- 
gliederung an Grenzpunkten zusammenhängender Einheiten orientiert (vgl. Stock 
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1996a, Bose 2001 und 2010; Apel 2018, 172ff.). Allerdings erfolgt die prosodi- 
sche Gliederung nicht allein aufgrund der syntaktischen Gegebenheiten eines 
Textes — sie kann auch aufgrund der Aussageabsicht des Sprechenden unabhängig 
davon geschehen (vgl. Apel 2018, 173). Durch solche eher rhetorisch und prag- 
matisch orientierten Gliederungssignale lassen sich Inhalte hervorheben und in- 
haltliche Zusammenhänge deutlich machen. Dies sollte ebenso beim Vorlesen 
von Nachrichten in Leichter Sprache genutzt werden, um wichtige und wesentli- 
che Teilaspekte innerhalb eines Satzes prosodisch abzugrenzen und damit hervor- 
zuheben. 


Das Beispiel 10 enthält das Transkript zur Vorlesefassung der MDR Nachricht in 
Leichter Sprache „In Mittel-Deutschland soll es mehr Sirenen geben“ vom 
21.07.2021. Es veranschaulicht die Sprechgliederung mittels Endmelodie und 
Sprechpausen und damit die verständnisfördernde prosodische Markierung se- 
mantisch zusammengehörender Wortgruppen als Sprecheinheiten. 


01 in EInigen BUNdesländern in DEUTSCHland gab es SCHLIMme UNwet- 
ter. ||.) 

02 DORT hatten die flüsse HOCHwasser.||(.) 

03 UND es gab ERDrutsche. || (°h) 

04 in dem UNwetter sind EInige menschen geSTORben.||(.) 

05 und SACHen sind kaPUTT gegangen. || (°h) 

06 zum BEIspiel;|(.) 

07 STRAßen-|(.) 

08 und die HÄUser von den menschen. || (-°h) 

09 JETZT sprechen die menschen DArüber, | (°h) 

10 dass es BESsere WARNsysteme in deutschland geben muss.||(.) 

11 DAmit sollen die menschen geWARNT werden wenn etwas geFÄHRliches 
passiert.||(.) 

12 zum BEIspiel-| (°h) 

13 wenn es eine naTURkatastrophe gibt. || 

14 wenn es eine UMweltkatastrophe gibt-| 

15 Oder wenn es einen großen BRAND gibt.|| (...) 


Bsp. 10: Transkript zur Vorlesefassung der MDR Nachricht in Leichter Sprache vom 
21.07.2021 (Audio 1) 


Akzentuierung 

Mittels sprecherischer Akzente werden relevante Informationen bzw. inhaltstra- 
gende Wörter hervorgehoben und damit für Zuhörende (besonders) deutlich ge- 
macht. Dies geschieht z. B. durch größere Lautheit, langsameres Sprechtempo, 
melodische Kontraste und präzisere Artikulation der akzentuierten Silbe. Typisch 
für Radionachrichten ist, dass viele Akzente in rascher Folge realisiert werden. 
Die Herausforderung besteht darin, in solchen inhaltlich hochverdichteten Texten 
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gezielt Akzente zu setzen, d. h. die besonders wichtigen, also neuen bzw. fokus- 
sierten Informationen hervorzuheben und damit das inhaltliche Verstehen der Hö- 
rer*innen zu unterstützen. 

Für das Vorlesen von Leichte-Sprache-Texten können hierbei zwei Strategien 
wirksam werden: Zum einen sollte die für Nachrichten typische hohe Informati- 
onsdichte durch das Formulieren eines einfachen und redundanten Textes mit 
zahlreichen erklärenden Ausführungen aufgelöst werden (siehe 3.1). Zum ande- 
ren sollten Akzenthäufungen bewusst vermieden werden, indem Akzente gezielt 
nur auf die inhaltlich neuen Wörter sowie den jeweiligen Satzfokus gesetzt wer- 
den. Daneben sollten die koreferenziellen Bezüge, die in den Texten enthalten 
sind (d. h. die Rück- oder Vorausbezüge auf bereits erwähnte oder noch zu aus- 
zuführende Elemente), durch die Akzentgestaltung ebenfalls deutlich herausge- 
stellt werden. 


Das Beispiel 10 (s. o.) zeigt den hörverständlichen Einsatz der Akzentuierung in 
der Vorlesefassung der Meldung „In Mittel-Deutschland soll es mehr Sirenen ge- 
ben“ vom 21.07.2021 (Audio 1). Die häufigen Akzente (vor allem in den ersten 
vier Sprecheinheiten, vgl. ZO1-04) sind typisch für das Genre Nachrichten (vgl. 
z. B. Schwenke 2020, 244ff.); durch die eher langsame Sprechgeschwindigkeit 
wird jedoch die informationsverdichtende Wirkung der Akzenthäufung vermie- 
den. 


3.3 Erarbeitung einer angemessenen Sprechhaltung als 
Grundvoraussetzung für barrierefreies Vorlesen 


Sprecherinnen und Sprecher im Radio müssen eine Sprechhaltung erarbeiten und 
prosodisch umsetzen, die nicht nur für die Textsorte Nachrichten und den konkre- 
ten Radiosender angemessen ist, sondern die auch die adressierte Zielgruppe ex- 
plizit anspricht. Sprechwissenschaftliche Untersuchungen zeigen, dass Zuhörende 
mit Radionachrichten eine bestimmte Erwartungshaltung verbinden: Als ange- 
messen gilt eine engagiert-freundliche, sachlich-informierende Sprechhaltung 
(vgl. Wachtel 2009a, 33ff.; Schwenke 2020, 336ff.). Diese Angemessenheitsvor- 
stellung ergibt sich aus medialen Sozialisationserfahrungen, die im Laufe der ei- 
genen Biografie erworben und unbewusst bzw. automatisiert zur Bewältigung all- 
tagsnaher Aufgaben abgerufen werden. Auch Menschen, die der diversen 
Zielgruppe der Rezipient*innen von Texten in Leichter Sprache zuzurechnen 
sind, haben als Teil der Gesellschaft und Sprachgemeinschaft Erfahrungen mit 
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verschiedenen Textsorten gemacht und können diese in der Regel wahrnehmen 
und abrufen: 


„Die Adressaten von ‚Leichter Sprache‘ verfügen über Textsortenwissen, und zwar über 
ein Textsortenwissen, das sich nicht grundsätzlich vom Textsortenwissen jedes anderen 
Sprachbenutzers unterscheidet. Das individuelle Textsortenwissen ist abhängig von der 
individuellen kommunikativen Erfahrung. In diesem Befund liegt ein besonderes Poten- 
tial für ‚Leichte Sprache‘, das bisher noch nicht ausgeschöpft ist: Texte können durch 
eine (textsorten-)typische Gestaltung wiedererkennbar, erwartbar und somit leichter zu- 
gänglich gemacht werden.“ (Bock 2019, 68). 


Was Bock hier v. a. bezogen auf die Gestaltung von Leichte Sprache-Texten fest- 
hält, gilt mit hoher Wahrscheinlichkeit auch für die sprecherische Gestaltung. 
Deshalb sollten barrierefreie Nachrichten in Leichter Sprache auch wie reguläre 
Nachrichten präsentiert werden und so klingen. Dies erfordert eine Anwendung 
der oben formulierten Sprechempfehlungen in Orientierung auf die besondere 
Zielgruppe bei gleichzeitigem Abrufen der typischen sprecherischen Merkmale 
der vermittelten Textsorte. 


In der Vorlesefassung der Meldung „In Mittel-Deutschland soll es mehr Sirenen 
geben“ vom 21.07.2021 (Audio 1) ist der sachlich-informierende Sprechstil von 
Nachrichten umgesetzt. Obwohl die Meldung viel langsamer gesprochen ist als 
klassische Nachrichten, gelingt es der Sprecherin, in dieser Sprechhaltung den 
Genrebezug deutlich werden zu lassen. Allerdings berichteten die Sprecher*innen 
der MDR Nachrichten in Leichter Sprache im Feedback-Workshop, dass es ange- 
sichts der besonderen (nicht-nachrichtlichen) Texteigenschaften schwierig für sie 
ist, eine angemessene nachrichtlich Sprechhaltung zu finden. Die Charakteristika 
der Texte verleiten eher zu einer Erzählhaltung, mit dem Ergebnis einer patroni- 
sierenden Sprechhaltung, wie sie in den Nachrichten für Kinder gelegentlich vor- 
kommt (vgl. Leuchte 2015). Um diesen ungewollten Duktus zu vermeiden, sollen 
regelmäßig reflektierende Feedbackrunden mit gemeinsamen Audioanalysen 
(sog. Airchecks) durchgeführt werden. Auch Reflexionsrunden gemeinsam mit 
der angesprochenen Zielgruppe helfen sicherlich, eine angemessene Sprechhal- 
tung zu finden und einzunehmen: Diese sollte weder patronisierend noch beleh- 
rend wirken, sondern sich dem Klang klassischer Radionachrichten annähern und 
der Maßgabe folgen, erwachsene Menschen bestmöglich mit Informationen ver- 
sorgen zu wollen. 
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4 Fazit 


Das Ziel, Nachrichten verständlich zu schreiben und hörverständlich zu sprechen, 
weist viele Parallelen zu den Zielen des Verfassens von Texten in Leichter Spra- 
che auf: Eine heterogene Zielgruppe soll angesprochen werden und den Funktio- 
nen der jeweiligen Texte (und Textsorten) entsprechend bestmöglich informiert 
werden. Das Konzept der Leichten Sprache bezieht sich bislang vorwiegend auf 
schriftlich präsentierte Texte, die bspw. auf Websites den Nutzer*innen zur Ver- 
fügung gestellt werden. Ausgehend von den Wünschen und Bedürfnissen der 
Zielgruppe spricht aber viel dafür, dass die weitaus häufigere Form die Nutzung 
von Audioangeboten ist, z. B. aufgerufen im Webangebot von Radiosendern oder 
zu festen Sendezeiten. Um analog zu den Regelkatalogen für das Erstellen von 
Texten auch entsprechende Regeln für die mündliche Präsentation zu erarbeiten, 
können die hier zusammengestellten Ausführungen eine Basis bieten. Eine empi- 
rische wissenschaftliche Prüfung dieser konkreten Regeln wird sich anschließen, 
ebenso sind Wirkungsuntersuchungen mit Vertreter*innen der Zielgruppe ge- 
plant. Die Praxistauglichkeit dieser Regeln wird im Rahmen der genannten Wis- 
senschafts-Praxis-Kooperation mit dem MDR derzeit erprobt. 

Für die anwendungsbasierte Implementierung von Vorleseregeln sowie die Be- 
wertung ihrer Praxistauglichkeit bleibt jedoch auch festzuhalten, dass es bei der 
Erstellung von barrierefreien Informationsangeboten nicht darum gehen kann, be- 
stimmte Vorgaben strikt einzuhalten. Vielmehr geht es um die Erarbeitung von 
Standards als übergeordnete Stilnormen, die Qualität und barrierefreie Hörver- 
ständlichkeit einerseits und einen gewissen Gestaltungsspielraum andererseits er- 
lauben. Denn schließlich sollte es darum gehen, barrierefreie und hörernahe An- 
gebote zu schaffen, die nicht nur das Nachrichtenformat erfüllen und 
Nachrichteninhalte in vereinfachter Form abbilden, sondern auch für einen Wie- 
dererkennungswert mit Identitätsbezug sorgen, um die künstliche Varietät der 
Leichten Sprache mit Leben zu füllen. 
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„dass der Hörer das Kopfkino einschalten kann“ 
Spannungsphasen und Formatbezug in Fußballreportagen 


Florian Eib, Leipzig / Ines Bose, Halle (Saale) 


Sportreportagen im Radio erfordern komplexes sprachliches Handeln. Von den 
Reporter*innen wird erwartet, dass sie das Fußballspiel möglichst umfassend, 
nachvollziehbar und empathisch beschreiben und für die Hörer*innen entspre- 
chend einordnen, damit ein gemeinsamer Vorstellungsraum entsteht. Im Folgen- 
den wird nach einer knappen Darstellung des Genres Fußballreportage über eine 
Untersuchung berichtet, die anhand der Fußballreportagen zum Bundesligaspiel 
RB Leipzig gegen Werder Bremen am 23. Oktober 2016 durchgeführt worden ist. 
Die sprach- und sprechstilistischen Analysen der Reportagen werden verknüpft 
mit Selbstauskünften der Reporter und mit Praxiserfahrungen des Autors, der 
auch als Fußballreporter tätig ist. 


1 Fußballreportagen 


Fußballreportagen sind in Deutschland die populärste Form der Sportreportage. 
Das hängt mit der Popularität des Sports insgesamt zusammen. Fußball gilt in der 
medialen Berichterstattung als Garant für hohe Einschaltquoten (vgl. u.a. 
Gerhard 2006; Koch / Zimmermann 2012); entsprechend hoch ist auch der Anteil 
an Fußballberichterstattung verglichen mit anderen Sportarten (vgl. Rühle 2017). 
Eine ursprüngliche und heute nach wie vor sehr beliebte Form der Fußballbericht- 
erstattung ist die Radioreportage. Die erste Fußballreportage in Deutschland be- 
richtete am 1. November 1925 vom Spiel Preußen Münster gegen Arminia Biele- 
feld (Drescher 1941, 11), damals wurde von „Stegreifberichten“ gesprochen — ein 
Vorläufer der heutigen Live-Reportage (vgl. Vorwerk o. J.). 
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Genrecharakter und Anforderungen 

Das Wort „Reportage“ leitet sich vom lateinischen „reportare“ ab, was so viel 
bedeutet wie „zurückbringen“ oder „zurückführen“. Es handelt sich bei einer Re- 
portage also um einen erlebnisorientierten, authentischen Bericht über ein Freig- 
nis. Für Kleinsteuber (2012, 245) ist sie die „Königsklasse des Radiojournalis- 
mus“, die von der „Spontaneität (und den Emotionen) des Augenblicks und von 
der bildreichen Schilderung des Geschehens vor Ort“ lebt. Die Fußballreportage 
ist eine spezielle Form der Live-Reportage im Radio. Fußballreporter*innen sol- 
len mit ihren Erklärungen, aber auch mit ihrem Sprach- und Sprechstil den Ra- 
diohörer*innen zu Hause das Spielgeschehen lebendig vermitteln. In der Tradi- 
tion der Radioreportage haben sich schon früh Anforderungen an (Live- 
)Reporter*innen herausgebildet. Geratewohl (1932, 427-432) skizzierte anhand 
von 27 Punkten sprach- und sprechtechnische Besonderheiten, die das damals 
neue Medium Radio seiner Ansicht nach erfordert. Whannel (1992, 26-27) ver- 
weist aufähnliche Ansätze von Wakelam und Joly de Lotbiniere Ende der 1930er- 
Jahre, ein weiterer stammt von Glendenning (1953, 66). Ihre Hinweise beeinfluss- 
ten spätere Generationen von Radiosprecher*innen. Einige Anforderungen an Re- 
portagen werden im Folgenden zusammengefasst: 


- Reporter*innen sollen den Spielverlauf freundlich und emphatisch vermit- 
teln (Hörerbezug). 

- Eine logisch sinnstiftende Reihenfolge der Ereignis-Schilderung ist ge- 
nauso wichtig wie Erklärungen und Interpretationen der Reporter*innen, 
damit die Hörer*innen das Ereignis nachvollziehen und darin eintauchen 
können (Verständlichkeit und Nachvollziehbarkeit). 

- Die Reportage soll lebendig und spontan wirken (Authentizität). 

- Atmosphärische Töne dürfen für sich sprechen (Vermittlung als Erlebnis). 

- Reporter*innen sollen durch ihre Schilderungen gezielt Spannung auf- 
bauen und transportieren (spannungsvolle sprachlich-sprecherische Gestal- 
tung). 


Die Fußballreportage ist abzugrenzen vom Fußballkommentar, der sich erst mit 
dem Fernsehen entwickelt hat. Die erste offizielle Fernsehübertragung in 
Deutschland fand am 26. Dezember 1952 in Hamburg statt. Anders als bei einer 
Radioreportage kann es nicht die Aufgabe des Fernsehkommentars sein, das Ge- 
schehen vor Ort möglichst bildhaft zu beschreiben, da das Fernsehen ja ein Bild 
vom Geschehen überträgt (vgl. u.a. Crystal / Davy 1983, 125 f., Tolson 2006, 
105; Eib 2018a, 12 f.). Morris / Nydahl (1985, 109) verweisen darauf, dass mittels 
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Bildgebung und Kameraführung im Fernsehen ein eigenes Event erschaffen wer- 
den kann: „The new drama has a cumulative power; it is rambling, repetitive and 
recursive, both in its visual and verbal presentation.“ (vgl. hierzu auch Marriott 
1995 und 1996). Der Fernsehkommentar hat dabei eine „begleitende“ Funktion 
zum Bild (Dankert 1969, 103). Bei einer Radioreportage sind es jedoch allein die 
Stimmen der Reporter*innen, die das Geschehen „plastisch“ machen (ebd., 94), 
sie (re-)präsentieren das Event auf komplexe Weise. 


Formen und Zielgruppen 

Abhängig von der Sendestruktur und der Zielgruppe gibt es verschiedene Formen 
von Fußballreportagen. Vollreportagen stellen eigene Sendungen dar und die Re- 
porter*innen berichten über die gesamte Spielzeit hinweg. Einschaltreportagen 
sind dagegen ein Teil von Sendungen (bspw. Sport- oder Nachrichtensendungen), 
in denen die Reporter*innen in regelmäßigen Abständen zugeschaltet werden, um 
den Hörer*innen einen Eindruck vom bisherigen Spielverlauf und vom aktuellen 
Spielstand zu vermitteln. 

Die Zielgruppe von Fußballreportagen bilden zunächst alle sport- und fußball- 
interessierten Radiohörer*innen. Es handelt sich hierbei zumeist um ein Fachpub- 
likum mit Vorwissen zur Struktur und zu den Regeln von Fußballspielen. Hinzu 
kommen Radiohörer*innen, die Sport- und Fußballreportagen als Entertainment 
schätzen. Darüber hinaus gibt es in Fanradios Reportagen, die vor allem Fans des 
jeweiligen Vereins ansprechen sollen. 

In den vergangenen Jahrzehnten hat sich eine weitere Form der Fußballrepor- 
tage für eine spezielle Zielgruppe entwickelt, die so genannte Blindenreportage 
für sehbehinderte und blinde Fans im Stadion (vgl. Eib 2018a, 14 f.; Naß et al. 
2017). Sie ähnelt in der Ansprechhaltung der Berichterstattung in Fanradios, denn 
sie richtet sich ebenfalls an Sympathisant*innen des jeweiligen Vereins. Inhaltlich 
ist sie allerdings von allen anderen Radioreportagen zu unterscheiden. Denn bei 
einer Blindenreportage liegt der Fokus deutlich stärker auf der Vermittlung des 
Spielgeschehens, vor allem auf der exakten Vermittlung der Position des Balles 
(Verortung). Andere Informationen rücken eher in den Hintergrund. Die Repor- 
tage soll sicherstellen, dass Menschen mit einer Sehbehinderung im Stadion den 
Verlauf des Spiels, der sich auch in den Reaktionen sehender Fans widerspiegelt, 
möglichst gut verfolgen und miterleben können. 


Untersuchungen zu Sprache und Sprechen in Fußballreportagen 


Die meisten vorliegenden Untersuchungen zum Genre Fußballreportage fokussie- 
ren Merkmale der sprachlichen Gestaltung; vgl. z. B. Dankert 1969, Vollmert- 
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Spiesky 1996, Burkhardt 2009 zur Lexikologie und Wortsemantik; Brandt 1983 
zum Tempusgebrauch; Lavric et al. 2008 mit gesammelten Beiträgen zu Fußball- 
terminologie und -sprache in multilingualer Perspektive; Schütt 2013 zur Bildbe- 
schreibung und zu deiktischen Ausdrücken. Prosodische Untersuchungen zu Fuß- 
ballreportagen haben unter anderem Müller / Mayr (2007) und Kern (2010) 
vorgelegt. Müller / Mayr (2007, 160) unterscheiden je nach Sprechinhalt des Re- 
porters drei „deictic contexts“: „On-line reference“ für einen nahezu synchronen 
Bezug zum Spielablauf, „Off-line reference“ für einen nicht synchronen Bezug 
zum Spielablauf und „Elaboration“ für analysierende Äußerungen, Hintergrund- 
beschreibungen fernab vom aktuellen Spielgeschehen. Kern (2010, 217) kenn- 
zeichnet zwei Sprechstile zur dramatisierenden Beschreibung von Aktionen auf 
dem Spielfeld, mit denen Reporter*innen ihre verbalen Handlungen kontextuali- 
sieren: „building up suspense“ und „presenting a climax“, und einen weiteren 
Sprechstil, mit dem Reporter*innen „summarizing and evaluating the match so 
far“ (ebd., 218). Alle Untersuchungen beziehen sich auf einzelne Fußballreporta- 
gen oder auf Vergleiche von Fußballreportage und -kommentar. 


2 Konzeption der empirischen Untersuchung 


In der vorliegenden Untersuchung wurden sprachliche und sprecherische Charak- 
teristika von sechs Fußballreportagen zu einem einzigen Spiel vergleichend ana- 
lysiert. Darüber hinaus wurden die betreffenden Reporter zu Motivation und 
Selbstverständnis ihrer beruflichen Sprach- und Sprechleistung befragt. Die Er- 
gebnisse der Spielanalysen konnten zu den Selbstauskünften der Reporter in Re- 
lation gesetzt werden (vgl. auch Eib 2018a und b). Ein weiteres Spezifikum ist, 
dass der Autor selbst als Sportreporter für private und öffentlich-rechtliche Rund- 
funksender arbeitet; dieses Erfahrungswissen wird im Folgenden die Analysen 
ergänzen. 


2.1 Datenerhebung 


Für die Untersuchung wurde ein Korpus aller sieben im Radio übertragenen Fuß- 
ballreportagen zum Bundesligaspiel RB Leipzig gegen Werder Bremen am 23. 
Oktober 2016 erstellt (siehe Tabelle 1). Damit spiegelt das Korpus den Gesamt- 
umfang einer Live-Berichterstattung zu einem Bundesliga-Fußballspiel exakt wi- 
der. Als Referenz wurde zusätzlich die Fernsehübertragung zu diesem Spiel auf- 
gezeichnet. Die sieben Radioreportagen unterscheiden sich in folgenden Punkten: 
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- Senderformat und institutionelle Verortung (Privat-Radio, Webradio, öf- 
fentlich-rechtlicher Rundfunk; überregional versus regional) 

- Zielgruppe (Fanradio, Informationsprogramm, Unterhaltungsmagazin) 

- Reportageform (Vollreportage versus Einschaltreportage) 

- Anzahl der Reporter (ein bis drei) und deren Professionalität (vom Sport- 
journalist mit großer Reportage-Erfahrung bis zum Fan von RB Leipzig mit 
geringer Reportage-Erfahrung) 


Radio Sachsen 


Sender / Sender / Zielgruppe Reportageform 
Programm 
Reportage 1 | ARD-Hörfunk Öffentlich-rechtlicher Sen- Einschaltreportage 
(ausführender Sender | der / Senderspezifische Ziel- |(1 Reporter: R1) 
MDR Aktuell) gruppe mit Sportaffinität 
Reportage 2 |Sportl.fm Webradio / Fußballfans Vollreportage 
(1 Reporter: R2) 
Reportage3 | MDRI Öffentlich-rechtlicher Sen- Einschaltreportage 


der / Senderspezifische Ziel- 
gruppe (40+) mit Sportaffini- 
tät 


(1 Reporter: R3) 


Reportage 4 |Radio Leipzig Privatradio / Senderspezifi- Einschaltreportage 
sche Zielgruppe mit Sportaffi- | (1 Reporter: R4) 
nität 

Reportage 5 |Bullenfunk Fanradio / Vollreportage 
Fans von RB Leipzig (2 Reporter: R5-1 

und R5-2) 

Reportage 6 | Blindenreportage Audioservice im Sinne der In- | Vollreportage 

RB Leipzig klusion / Fans von RB Leipzig | (3 Reporter: R6-1 
(im Stadion) bis R6-3) 
Reportage 7 | Radio Öffentlich-rechtlicher Sen- Einschaltreportage 
Bremen 1 der / Senderspezifische Ziel- |(1 Reporter) 
gruppe mit Sportaffinität 

Fernseh- Fernsehübertragung |Sky / Pay-TV, Schwerpunkt |Kommentar 

kommentar Bundesliga-Berichterstattung | (1 Kommentator) 


Tab. 1: Übersicht über das gesamte Audio- und Videokorpus 


Die Reportagen wurden live mitgeschnitten bzw. vom ausführenden Sender im 
Nachhinein zur Verfügung gestellt (Reportage 1). Die Aufnahme der Reportage 
6 erfolgte durch den Autor selbst, der auch einer der ausführenden Reporter bei 
diesem Spiel war. 
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Nach der Sichtung des Korpus wurde mit den Reportern eine qualitative Frage- 
bogen-Analyse durchgeführt, Der Fragebogen beinhaltete Fragen zu ihrem 
Selbstverständnis, zur sprachlichen und sprecherischen Gestaltung sowie zu ihren 
Erfahrungen im Bereich Sportreportage. Den Reportern wurde durch offene Fra- 
gen Raum für eine ausführliche Beantwortung der Fragen gegeben. 


2.2 Datenaufbereitung, Analysekorpus und -methoden 


Für die Untersuchung wurden die Audiospuren der Reportagen mit Hilfe des Pro- 
gramms iMovie mit dem Video-Mittschnitt des Spiels sekundengenau synchroni- 
siert (siehe Abbildung 1). Somit war exakt vergleichbar, in welcher Reportage 
welcher Reporter zu welchem Zeitpunkt des Spiels wie agiert hat. 


Sn Ss Me a 
arme see 


Abb. 1: Screenshot der mit dem Video synchronisierten Audiomitschnitte (iMovie) 


Für die vergleichende Analyse wurden zwei Spielszenen ausgewählt, die wesent- 
liche Elemente des Spielverlaufs enthalten (bspw. Spiel im Mittelfeld, Torannä- 
herung, Torschuss / Torchance, Torerfolg) und über die möglichst viele Reporter 
berichtet haben: 


- Die Spielszene 1 stammt aus der Anfangsphase des Spiels. Hier findet sich 
die erste nennenswerte und klare Torchance der Partie, aus der allerdings 


kein Tor resultiert. 
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- Die Spielszene 2 wurde ausgewählt, weil sie neben den für Fußball typi- 
schen Aspekten des Spielverlaufs (hier Freistoß und ruhige Ballbewegung) 
auch die Spannung der Endphase des Spiels und einen Torerfolg beinhaltet. 


Ein weiteres Auswahlkriterium war, dass möglichst viele Reporter gleichzeitig 
auf Sendung gewesen sein sollten. Betrachtet werden konnten sechs Reportagen, 
wobei der Reporter R3 nur in der Spielszene 2 zum Spiel gesprochen hat und der 
Reporter R4 nur in der Spielszene 1. 


Spielszene Spielminute | Dauer Reporter auf Sendung 


Spielszene 1 |04:04-05:39 |ca. 95 Se- | ARD-Hörfunk (R1) (Audio 1) 

kunden Sportl.fm (R2) (Audio 2) 

Radio Leipzig (R4) (Audio 3) 

Bullenfunk (R5-1, R5-2) (Audio 4) 
Blindenreportage RB Leipzig (R6-1) (Audio 5) 


Spielszene2 [91:37-94:17 |ca. 160 Se- | ARD-Hörfunk (R1) (Audio 6) 

kunden Sportl.fm (R2) (Audio 7) 

MDR] Radio Sachsen (R3) (Audio 8) 
Bullenfunk (R5-1, R5-2) (Audio 9) 
Blindenreportage RB Leipzig (R6-1) (Audio 10) 


Tab. 2: Übersicht über das Untersuchungsmaterial 


Im Folgenden werden ausgewählte Untersuchungsergebnisse aufgeführt (ausführ- 
lich vgl. Eib 2018 a und b). Die Transkription orientiert sich an GAT2 (Selting et 
al. 2009). Die Audios zu den im Beitrag behandelten Beispielen (Transkripten) 
sind verfügbar über den QR-Code zu Beginn des Artikels bzw. unter: 
https://cloud.uni-halle.de/s/BeEQ69u27XjsNme. 


3  Selbstauskünfte der Reporter 


Die Fragebogen-Angaben der Reporter zu ihren beruflichen Erfahrungen und ih- 
rem Selbstverständnis sind in der Tabelle 3 zusammengefasst und exemplarisch 
illustriert (vgl. auch Eib 2018a, 28-34; 110-113): 


Orientierung an erfahrenen Reportern vs. eigener Stil 


R1: Ich habe mir viel bei Kollegen angeschaut, wie sie den Job be- 


greifen [..] und welche handwerklichen Mittel sie wie und wann 
einsetzen. 

R2: Mir gefiel Werner Hansch [..] trotzdem kopiere ich ihn sicherlich 
nicht. 
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R4: Inspiration gibt es genug und kann nicht schaden. Ich versuche 
immer so zu sein, wie ich kin [..] wie ich es auch gerne hören 
würde. Wichtig für mich: es muss authentisch sein und keine Ko- 
pie von irgendeinem Sportkommentator. 


„Learning by doing“ und Feedback 


R2: Ich durfte das Spiel übertragen ohne vorher im Radio jemals auch 
nur ‚Piep‘ gesagt zu haben Ich habe es so übertragen, wie ich 
meinte, dass es gut sei. (über seine Anfangszeit bei einem Lokalradio, F. E.) 

R3: Jedes Spiel ist ein Überraschungs-Ei. Keiner weiß, was drin ist. 

R5-1: Dabei habe ich mir regelmäßig Feedback der Zuhörer geholt. 
Gleichzeitig habe ich die Kommentierung auch öfter mal aufge- 
zeichnet, um im Nachgang zu airchecken. 

R5-2: Ich habe die Reportertätigkeit nie wirklich erlernt. Seit dem 
ersten Tag geht es darum, Erfahrungen zu sammeln, anderen Re- 


portern zu lauschen und sich selbst ständig zu hinterfragen und 
zu reflektieren. 


Hörerorientierung 


R2: [..] dass der Hörer das Kopfkino einschalten kann, die Angriffe 
auf einem Blatt Papier nachzeichnen kann und am Ende das Gefühl 
bekommt im Stadion zu sein. 


R3: Das Wichtigste: Du musst deinen Hörer mitnehmen. 
RS5-2: Emotionalität, um den Hörer mitzureißen (Stadionfeeling). 


Bewusster und individueller Sprachstil 


RI: Ich versuche auf herkömmliche Begriffe und feststehende Floskeln 
zu verzichten. Frische und kreative Sprache sollte ein Anspruch 
sein. Das wichtigste und gleichermaßen schönste Mittel im Be- 
reich des Radios sind sprachliche Bilder, deren Einsatz sinnvoll 
und kreativ sein muss. Das Großartige daran ist, dass es kaum 
Grenzen für diese Bilder gibt, so lange eine Reportage nicht da- 
mit überfrachtet wird und die Bilder um ihrer selbst willen ent- 
wickelt werden. 


R2: Großer Wortschatz sorgt für Synonyme, um Wiederholungen von Wor- 
ten und Bezeichnungen zu vermeiden [..] Bilder kreieren [..]. Bunt 
und lebhaft. Auch bei den anderen Reportern kann ich mir einiges 
abschauen. Aber eben auch entscheiden, dass ich viele Dinge 
nicht so machen möchte, wie manch Kollege. Jeder muss sich in 
seiner Aufgabe und in der Umsetzung wohl fühlen. 

R4: Inspiration gibt es genug und kann nicht schaden. Ich versuche 
eigene, manchmal komisch klingende Formulierungen zu verwenden. 
IR-1: Ganz oben steht bildhafte Sprache. Das ist für mich als Radio- 
reporter das A und O. Vergleiche, gern auch zu anderen Lebensbe- 
reichen, sorgen für Abwechslung und lockern auf. 
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Bewusster Einsatz des Sprechstils 


R1: Lautstärke und Stimmeinsatz sind auch wichtige Stilmittel, die 
in verschiedenen Situationen variabel eingesetzt werden müssen. 

R3: Den Spielfilm mit eigenen Meinungen wiedergeben [..] Das Wich- 
tigste: Du musst deinen Hörer mitnehmen. [..] mit aufgebautem 
Spannungsbogen, mit lauten, aber auch leisen Tönen. Je nach der 
Ergebnislage im Spiel. 

R4: Stimmklang und Sprechtempo versuche ich gezielt einzusetzen, um 
mehr Variation zu bekommen und Aufmerksamkeit zu erlangen. 

RS5-1: Mein Ziel ist, dass meine Hörer sich vorstellen können, wie 


das Spiel gerade abläuft oder wie ein Tor gefallen ist. [..] Ne- 
ben dieser genauen Beschreibung ist es mir wichtig, die Stim- 
mung gut einzufangen und Abwechslung zu bieten. [..] Stimmlich 


setze ich auf Tempowechsel, so wie das Spiel verlangt und na- 
türlich auch in der Lautstärke. 


Tab. 3: Zusammenfassung der Selbstauskünfte der Reporter 


Kein Reporter gab an, das Sprechen in Fußballreportagen nach einer Art Leitfaden 
erlernt zu haben. Prägend sei die praktische Tätigkeit als Reporter über einen in- 
dividuell unterschiedlich langen Zeitraum hinweg gewesen. Als Korrektiv dienten 
Selbst- oder Fremdfeedback. Das Fremdfeedback (vor allem durch Kolleg*innen) 
bezieht sich nach der Erfahrung des Autors allerdings weniger auf konkrete 
sprechtechnische Anweisungen („mehr Tempo“, „lauter“ etc.), sondern eher auf 
den Gesamteindruck einer dem Genre angemessenen Sprechweise, etwa „du 
musst mit deiner Stimme mehr Spannung erzeugen“ oder „du bist zu unemotio- 
nal“. Die befragten Reporter formulierten übereinstimmend zwei Anforderungen: 


- Spezifischer, bildhafter Sprachstil: Sie wollen mit Sprache ein Bild des 
Spiels zeichnen und sie achten bewusst auf Theatralik und Individualität. 
Dieser Anspruch zeigt das Bewusstsein der Reporter von der bildgebenden 
Funktion einer Reportage. 

-  Spezifischer, emotionaler Sprechstil: Sie wollen die Zuhörer*innen mitrei- 
Ben, emotionalisieren, das Spiel spannend vermitteln. 


Beiden Anforderungen gerecht werden zu wollen, zeichnet den hohen Selbstan- 
spruch der befragten Sportreporter aus. In ihrer Tätigkeit orientieren sie sich an 
Sprech-Vorbildern („ARD-Bundesligakonferenz“, „Werner Hansch“, „Wolff- 
Christoph Fuss “). Dabei soll jedoch keine Imitation entstehen, sondern sie zielen 
auf einen eigenen „authentischen“ (R4) Stil. Insgesamt entsteht nach der Befra- 
gung der Reporter folgender Gesamteindruck, der auch durch die Erfahrungen des 
Autors geteilt wird: 
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- Als Antrieb, der Tätigkeit als Fußballreporter nachzugehen, erweist sich die 
eigene Leidenschaft. 

- Als Fan von Sportveranstaltungen wollen die Reporter diese Ereignisse 
möglichst gut im Radio transportieren. 

- Durch die große Dichte des Reportagen-Angebots (allein bei diesem Spiel 
zehn Reporter auf sieben Radiosendern) entsteht ein hoher Selbstanspruch, 
da es zunehmend schwer ist, sich gegenüber anderen Reportern hervorzu- 
tun. 

- Damit verbunden ist das Streben nach einem eigenen Stil. 

- Das Stilverständnis der Reporter richtet sich vorwiegend auf sprachstilisti- 
sche Charakteristika (etwa ansprechende Sprachbilder, treffende Analysen, 
Darstellung eines Expertenwissens). 

- Die Reporter arbeiten aber auch bewusst mit sprechstilistischen Mitteln; 
jeder Reporter hat eine eigene Vorstellung davon, wie er die Spannung in 
einem Spiel stimmlich übermittelt. 

- Als sprechstilistische Merkmale werden vor allem Lautstärke, Sprech- 
tempo und Stimmklang sowie Sprechmelodie und deren jeweilige Varia- 
tion genannt. Monotones Sprechen wird von den Reportern als eher nicht 
passend beschrieben: „Langeweile vermeiden“ (vgl. z. B. R5-2). 


4 Spannungsphasen im Spielverlauf 


Ausgangspunkt der Analyse war eine Einteilung des Fußballspiels in Spannungs- 
phasen (ausführlich vgl. Eib 2018a, 35-38). Diese Einteilung beruht sowohl auf 
der Reporter-Erfahrung des Autors, wird darüber hinaus aber auch gestützt durch 
die Videoauswertung der vorliegenden beiden Spielszenen sowie durch die Aus- 
sagen zum Selbstanspruch der Reporter, z. B. „Beschreibung der Spielsituation“ 
(R6-2) oder „immer auf Ballhöhe“ (R5-2). Wesentliche Kriterien für den Span- 
nungsbogen eines Fußballspiels sind die Position des Balls (des bespielten 
Raums) und die immanente Möglichkeit, ein Tor zu erzielen. 

Das Analyse-Instrument fußt unter anderem auf einer Untersuchung von 
Kuhn / Maier (1978) zu Spielmerkmalen, die zum Erfolg oder Nichterfolg einer 
Mannschaft beitragen. Kuhn / Maier haben damit die Vorarbeit geleistet für die 
heute in jeder Taktikanalyse verwendeten Kriterien Ballbesitz, Torschüsse, Zwei- 
kampfquote, Passquote oder Anzahl der Flanken und Freistöße. Für ihre Untersu- 
chung entwickelten Kuhn / Maier einen „Schlüssel für fußballrelevante Merk- 
male“ (ebd., 45), zu dem auch die für diese Arbeit vorgeschlagene Einteilung in 
„Ball im Spiel“ und „Ball aus dem Spiel“ gehört. Außerdem schlugen Kuhn 
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/ Maier eine Segmentierung des Fußballfeldes in relevante Zonen vor (ebd., 47), 
was in der Grundidee für die vorliegende Untersuchung übernommen worden ist; 
die Anzahl und die Lokalisierung der Zonen wurden allerdings den Ansprüchen 
der Untersuchung angepasst. 


Spannungsphase |SP1 SP2 SP3 SP4 SP5 
Kurzbeschrei- Ball aus dem | Ruhiges Deutliches | Klare Tor- Torerzie- 
bung Spiel Spiel Angriffs- chance oder lung 
(Mittelfeld) |spiel/ Eck- | Schuss Rich- 

ball, Frei- tung gegneri- 

stoß Rich- sches Tor 

tung Straf- 

raum 
Ball im Spiel Nein ja Ja Ja ja 
Ball / Bewegung | Nein nein Ja Ja ja/nein 
im Angriffsdrittel 
Torchance un- Nein nein Nein Ja ja/nein 
mittelbar zu er- 
warten 
Torerzielung Nein nein Nein nein ja 


Tab. 4: Matrix zur Einteilung eines Fußballspiels in Spannungsphasen 


Orientiert an dieser allgemeinen Einteilung wurden die beiden ausgewählten 
Spielszenen in Spannungsphasen unterteilt, um differenziert untersuchen zu kön- 
nen, ob und wie die Reporter auf Änderungen im Spielverlauf reagieren. Hierfür 
erfolgte zunächst eine Bildanalyse anhand der Videoaufnahme. Anhand des Spiel- 
videos wurde der Übergang der Spannungsphasen zeitlich genau festgelegt. Die 
Einteilung des Spielgeschehens dient der Vergleichbarkeit der Reportage-Aus- 
schnitte (siehe Tabelle 5). 


Spielszene 1 Spiel- 
zeit 


Spannungs- EZAT 1ı/| 2| 3) A 1| 2A 3) 2 3/1 
phase 


Beginn 04: | 04: | 04: | 04: | 04: | 04: | 04: | 04: | 05: | 05: | 05: | 05: 
(min) 04 |11 128 |36 |45 148 |50 156 |14 |20 129 |32 
Länge (s) 3 112.185 297153211225 | #65 11:8: 1762129211 23.4187. 955 
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Spielszene 2 Spiel- 
zeit 


Spannungs- | 2| 1| 2| 3) 4) 1| 2| 3| 2 1| 2| 31 4| 5 
phase 


Beginn 91: |91: |92: |92: |92: |92: | 92: |92: \92: 1192:1193: 93; 94: |94: 
(min) 37 |41 100 |10 |20 |20 |30 |34 |38 |44 |53 |58 |01 105 


Länge (s) AA E E O COVOR KA 41292 1.48% 342110563: 156921175 1321, 34° "2 160s 


Tab. 5: Einteilung der beiden untersuchten Spielszenen in Spannungsphasen 


Die Tabelle 5 zeigt, dass die Spannungsphasen in den beiden Spielszenen unter- 
schiedlich oft auftreten und sich auch in ihrer Dauer unterscheiden. Am häufigsten 
und längsten sind die gemäßigten Spannungsphasen 1 (siebenmal, zwischen 7 s 
und 69 s lang) und 2 (neunmal, zwischen 4 s und 18 s lang), gefolgt von der kür- 
zeren Spannungsphase 3 (sechsmal; zwischen 3 s und 10 s lang). Die Spannungs- 
phase 4 (Torchance/Torschuss) kommt dagegen nur zweimal vor und dauert nur 
1 bzw. 2 Sekunden. Die Spannungsphase 5 (Torerzielung) kommt einmal vor und 
dauert 12 Sekunden. 


5  Sprachliche Gestaltung der Fußballreportagen 


5.1 Aktions- und sonstiger Text 


Für die Analyse der sprachlichen Gestaltung der Reportagen wurden zwei Text- 
formen unterschieden: Mit dem so genannten Aktionstext (in Anlehnung an Ro- 
senbaum 1969) nehmen die Reporter Bezug auf das aktuelle Spielgeschehen. Zum 
sonstigen Text gehören beispielsweise Rahmenbedingungen (Wetter, Kulisse), 
Analysen von Ergebnis und Spielverlauf (besondere Vorkommnisse), Wertungen, 
Prognosen und Hintergründe (vgl. Scheu 2017, 231; Crystal / Davy 1983, 125). 
Scheu (2017, 232) empfiehlt für eine „gute Live-Reportage“ das Verhältnis von 
zwei Dritteln Aktionstext und einem Drittel sonstigem Text, der „nicht mehr als 
Beiwerk“ (ebd.) sein sollte. Der sinnvolle und spielrelevante Wechsel verschie- 
dener Textformen stellt für Fußballreporter*innen eine große Herausforderung 
dar (vgl. Scheu 2017, 231). Nach Scheu (ebd., 232) sollte der Aktionstext sprach- 
lich dicht und engagiert gestaltet sowie laut(er) und schneller gesprochen werden, 
die sonstigen Informationen rund um das Spiel sollten dagegen sachlich gestaltet 
sowie ruhiger und langsamer gesprochen werden. Diese Differenzierung erscheint 
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theoretisch möglich, wird praktisch aber nur tendenziell umgesetzt. Im untersuch- 
ten Korpus wurden auch zahlreiche absolut sachlich gesprochene Aktionstext- 
Passagen festgestellt (siehe z. B. die Aussagen von R2 im Abschnitt 5.3, ebenso 
Transkript 3 im Abschnitt 6.2). 


Ein wichtiges Stilmittel von Fußballreportagen sind so genannte Nachschilderun- 
gen (vgl. Scheu 2000, 201 f.; früher auch „Nachtragstext“, vgl. Rosenbaum 1969, 
17). Sie können als besondere Form des Aktionstextes interpretiert werden, da sie 
(rückblickend) auf eine bestimmte Spielszene bezogen sind (z. B. Torchancen, 
Foulspiele, bemerkenswerte Einzelaktionen oder Spielzüge). Sie liefern den Hö- 
rer*innen eine Art Zeitlupe der Szene. Die Reporter entscheiden frei über Einsatz, 
Anzahl und Umfang von Nachschilderungen. Nach der Erfahrung des Autors sind 
sich Fußballreporter darüber einig, dass Nachschilderungen unbedingt erforder- 
lich sind, v. a. nach Torerfolgen und Großchancen, diskussionswürdigen Schieds- 
richter-Entscheidungen (sog. Kernszenen). Nachschilderungen knüpfen an das 
Selbstverständnis der Reporter an, den Hörer*innen einen möglichst umfassenden 
und detailgenauen Zugang zu Informationen zu ermöglichen. Es versteht sich für 
die Reporter daher von selbst, dass wichtige Spielhandlungen noch einmal nach- 
betrachtet werden (sollten), häufig auch mit einem emotionalen Nachvollzug, der 
unter anderem an erhöhter Sprechlautstärke und / oder Sprechgeschwindigkeit er- 
kennbar ist. 

In den beiden hier untersuchten Spielszenen (insgesamt 255 s) haben die Re- 
porter durchschnittlich 26 Sekunden für Nachschilderungen genutzt. Der auf die 
Großchance (in Spielszene 1, ab Spielminute 04:48) folgende Spielabschnitt (ab 
ca. 04:52) wurde von allen Reportern mit einer Nachschilderung versehen. Diese 
Chance kann demnach als Kernszene betrachtet werden. Ausgehend von der Ein- 
teilung in Spannungsphasen ist die Wahrscheinlichkeit für Nachschilderungen 
nach den Spannungsphasen 4 und 5 besonders hoch, weil diese Phasen extrem 
kurz sind und zumeist nur wenige Sekunden andauern, was eine detailgenaue Be- 
schreibung des Geschehens nahezu unmöglich macht und eine detaillierte Be- 
schreibung im Anschluss erfordert. 


5.2 _  Genrespezifik 


Der konkrete Einsatz sprachstilistischer Mittel wurde exemplarisch an einer aus- 
gewählten Reportage-Sequenz des Reporters R1 analysiert. Betrachtet wurde 
seine Reportage der Spielszene 1, in der alle Spannungsphasen bis auf die Torer- 
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zielung enthalten sind (Audio 01). Die Analyse verweist neben der typischen Ver- 
wendung von Fußball-Lexik u. a. auf folgende genrespezifische sprachliche Be- 
sonderheiten, die unabhängig von den Spannungsphasen auftreten. 


256 


Kontextualisierung: Kontextwissen wird bei den Rezipient*innen notwen- 
digerweise vorausgesetzt, nur so funktionieren Äußerungen wie „Kaiser 
aus zentraler Position 18 Meter Torentfernung “ (ab 04:25) oder „Poulsen 
gegen zwei“ (ca. 04:48), Nennungen von Nachnamen zur knappen Markie- 
rung von Handelnden (,, Poulsen“, „Kaiser“ etc.) bzw. verkürzte Kollek- 
tivbezeichnungen wie „Werder“ (für Werder Bremen) oder „Leipzig“ (für 
RB Leipzig). 

Einschübe und Ergänzungen: Meistens handelt es sich um Zusatzinforma- 
tionen zur Einordnung, wie „Da wird gezupft und — das muss man Yussuf 
Poulsen auch zugutehalten — der lässt sich eben nicht fallen“ (ab 05:03); 
„der den nach wie vor schwer verletzten — an der Hand verletzten — Drobny 
vertritt“ (ab 05:11). 

Konnektoren (im Verständnis von Breindl et al. 2014, 14) erhalten den 
Sprechfluss aufrecht und treten gehäuft und in diversen Funktionen auf, z. 
B. additiv („und Werder muss damit erst mal zu Rande kommen “, 04:40), 
kausal („Da sprang der Ball aber so ein bisschen vorher auf und deswegen 
schaufelte er den Ball so vorbei und drüber“, 04:28), adversativ („Aber 
man sieht hier ganz deutlich: RB Leipzig wie immer dominant“, 04:35) oder 
metakommunikativ („also keine Gefahr für den Kasten von Felix Wie- 
dwald‘, 04:33). 

Deiktische Ausdrücke: Sie erzeugen Nähe, da ein gemeinsamer Erlebnis- 
raum mit den Hörer*innen geschaffen wird. Dabei muss der Reporter stets 
sicherstellen, dass der Referenzpunkt klar ist: „ Hier ist sowieso jeder über- 
all“ (04:21, Referenzpunkt ist das Spielfeld); „Jetzt kommt Leipzig schon 
wieder“ (04:46, zeitliche Synchronisierung — in diesem Moment sind die 
Hörer*innen quasi mit am Ball); „Die können den da nicht halten“ (05:00, 
Referenzpunkt vorher geklärt: im oder am Strafraum). 

Zeitökonomischer Sprachgebrauch: Verkürzte Satzstrukturen treten vor- 
rangig in den höheren Spannungsphasen 3 bis 5 auf. Dagegen finden sich 
in den Spannungsphasen 1 und 2 häufiger vollständige Sätze. Hier ist die 
Spielspannung geringer und es bleibt mehr Zeit zum Sprechen. 

Kreativer Sprachgebrauch (vgl. ausführlich Eib 2018b, 57-59): „Visier von 
Anfang an oben“ (04:06); „der [...] heute die rechte Außenbahn rackern 
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darf“ (ab 04:16); „schaufelte er den Ball“ (04:30); „macht da beide Innen- 
verteidiger nass“ (04:52). Typisch sind übertrumpfende Steigerungen 
(bspw. „Möglichkeit“, „Chance“, „Riesenchance‘“), Metaphern, drasti- 
sche Vergleiche und Übertreibungen. 


Im Sprachstil zeigt sich nicht nur die Genrespezifik, sondern auch die Individua- 
lität der Reporter. In der Befragung zeigte sich, dass die Reporter ganz bewusst 
an einem individuellen Sprachstil arbeiten. Aus eigener Erfahrung kann der Autor 
berichten, dass sich die Auswahl markiger bzw. situativ passender Beschreibun- 
gen und Ausdrücke nach mehreren Kriterien richtet: 


- Persönliches Sprachgefühl 

- Situative Passung — Kürze und Prägnanz 

- Bildliche Kraft des Ausdrucks 

- Einzigartigkeit gegenüber anderen Reportern (ständig in anderen Reporta- 
gen gehörte Redewendungen werden eher gemieden) 


5.3  _Formatbezug und Zielgruppenorientierung 


In Abhängigkeit von Zielpublikum und Senderformat (siehe Tabelle 1) zeigen 
sich Unterschiede in der inhaltlichen Fokussierung und der sprachlichen Gestal- 
tung der Reportagen. Die im Folgenden aufgeführten Beispieläußerungen bezie- 
hen sich nicht speziell auf die beiden ausgewählten Spielszenen, sondern auf den 
gesamten Verlauf der Reportagen. 


Öffentlich-rechtlicher Hörfunk (R1, R3 und R7) 

Die Reporter des öffentlich-rechtlichen Rundfunks berichten weitgehend objektiv 
und analytisch in der Sprechrolle des kompetenten, analysierenden Experten über 
das Spielgeschehen, liefern Hintergrundinformationen zu beiden Teams und ord- 
nen Sachverhalte ein. Stellvertretend wird das an folgenden Äußerungen des Re- 
porters R1 (ARD) deutlich: 


R1, Spielminute 54:24 (Audio 11) 

Knapp 55 Minuten absolviert und jetzt! Jetzt ist es ein Fußball- 
spiel, denn Werder Bremen hat auch einen Vorwärtsgang, von dem war 
nichts zu sehen in der ersten Halbzeit. 

R1, Spielminute 58:24 (Audio 12) 

Werner (Leipzig) der ist im Strafraum am linken Flügel. Zwei wei- 
tere Leipziger im Strafraum. Werner versucht es alleine - ach den 
hätte er lieber durchgesteckt. 
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Dass der Leipziger Spieler Werner dafür verantwortlich ist, dass die Torchance 
nicht besser ausgespielt wurde, wird von R1 beschrieben und eingeordnet. Letz- 
teres fehlt beispielsweise beim Fanradio Leipzig (R5 vom Bullenfunk; s. u.). Kurz 
darauf bewertet R1 den Spieler Werner geradezu drastisch als „ein bisschen zu 
egoistisch, zu verfressen““: 


R1, Spielminute 58:33 (Audio 13) 

[..] auf Forsberg (Leipzig) und auf Poulsen (Leipzig). Die warteten 
da, die liefen synchron rein. Gute Laufwege der beiden Offensiv- 
männer. Aber Timo Werner (Leipzig) wollte eben ganz gerne selber 
sein viertes Saisontor erzielen. Das war ein bisschen zu egois- 
tisch, zu verfressen in dieser Situation. Deswegen war es am Ende 
auch kein Problem für zwei Werder-Verteidiger, diese Situation zu 
klären. 


Die Bewertungen und Einschätzungen von R1 betreffen in der Regel aber die Ak- 
tionen beider Teams: 


R1, Spielminute 61:40 (Audio 14) 

Bremen etwas besser in dieser zweiten Halbzeit, aber nach wie vor 
nicht durchschlagskräftig genug, um hier tatsächlich den Treffer 
zu erzielen. RB Leipzig auch, wie in der ersten Halbzeit, mit mehr 
Ballbesitz, deswegen geht auch diese 1:0 Führung - die knappe - 
immer noch in Ordnung. 


Fußball-Internetradio (R2) 

Das Fußball-Internetradio Sportl.fm ist der Berichterstattung öffentlich-rechtli- 
cher Sender stilistisch ähnlich. So berichtet der Reporter R2 ebenfalls über beide 
beteiligten Teams. Die Ansprechhaltung ist allerdings lockerer, kumpelhafter, 
was bspw. deutlich wird durch die d 

irekte, persönliche Ansprache der Spieler auf dem Platz und der Zuhörer*innen 
am Radio: 


R2, Spielminute 01:51 (Audio 15) 

Clemens Fritz, liebe Werder-Fans, da atmet ihr vielleicht auf, der 
war ja angeschlagen, aber er kann mitmachen. 

R2, Spielminute 03:45 (Audio 16) 

Also liebe Fußballfreunde auf dem Rasen. Ihr wisst schon, die Par- 
tie hat gerade erstmal angefangen, ne? (als Reaktion auf gute Tor- 
chancen gleich zu Beginn des Spiels) 

R2, Spielminute 04:54 (Audio 17) 

Das geht nicht, liebe Bremer. Ihr dürft ihn natürlich da nicht 
laufen lassen. 


R2 bewertet die Aktionen auf dem Spielfeld zudem häufiger als R1, vgl. z. B.: 
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R2, Spielminute 53:28 (Audio 18) 

wie Bernardo (Leipzig) das da eben gegen Serge Gnabry (Bremen) klä- 
ren konnte - überragend gemacht, das muss man wirklich sagen. 

R2, Spielminute 67:03 (Audio 19) 

Kaiser legt dann noch mal ab auf Timo Werner (Leipzig), der - meine 
ich - könnte offensiv mehr tun, taucht nicht so oft in den 
Offensivaktionen auf. 

R2, Spielminute 78:07 (Audio 20) 

Gebre Selassie (Bremen) köpft den Ball weg - unmotiviert, hätte man 
besser machen können. War Zeit, war Raum, war Platz. Ist jetzt 
Ballverlust. 

R2, Spielminute 80:23 (Audio 21) 

Und Halstenberg (Leipzig) hatte Zeit - Strafraumlinie, starker lin- 
ker Fuß - [..] aber die Schussrichtung war schon Richtung Eckf£fahne. 
[..] Also das war nix. Hätte man mehr draus machen können. 


Lokalradio (R4) 

Der Reporter R4 vom lokalen Privat-Radiosender Radio Leipzig setzt den Fokus 
auf das regionale Team und auf eine emotionale Nähe zum Verein, z. B. durch die 
mehrfache Bezeichnung des Leipziger Teams mit dessen Vereinsspitznamen 
(„Die roten Bullen“) oder durch Bekundung von Erleichterung bei gutem Ergeb- 
nis: 


R4, Spielminute 04:17 (Audio 22) 

Aber die Bullen, die zeigen hier schon mal heute, wie der Takt 
laufen soll am Ende. 

R4, Spielminute 34:47 (Audio 23) 

Es hat ein bisschen gedauert, bis hier die Gäste der Roten Bullen 
auch ins Spiel gefunden haben. Und jetzt spielen sie mit und ma- 
chen es den Bullen ganz schön schwer. 

R4, Spielminute 44:56 (Audio 24) 

Es bleibt hier beim 1:0 und ja mit dieser frohen Kunde gebe ich 
wieder zurück zu dir. 

R4, Spielminute 49:15 (Audio 25) 

Also hier Gott sei Dank erst mal noch beim 1:0. (bei Leipziger Führung) 


Fanradio (R5) 

Stark im Kontrast zur öffentlich-rechtlichen Reportage 1, aber stilistisch ähnlich 
zur Reportage 4 (Lokalradio) ist die Berichterstattung des Fan-Radios. Es geht 
ebenso um die emotionale Verbundenheit, die Nähe zum Verein wird hier aller- 
dings noch deutlicher sprachlich markiert. So werden in der Reportage 5 (Fanra- 
dio Leipzig: Bullenfunk) auffällig häufig Aktionen der Leipziger Spieler hervor- 
gehoben und gelobt, bis hin zur Beschönigung und Umwertung des 
Spielgeschehens, und die Reporter identifizieren sich mit „ihrem“ Team: 
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R5-2, Spielminute 52:40 (Audio 26) 

Nächste gute Möglichkeit für unsere Jungs 

R5-2, Spielminute 55:43 (Audio 27) 

Der gefährlichste Bremer bis hierhin auf jeden Fall Serge Gnabry 
[..], stand glaube ich auch so ein bisschen auf der Liste bei RB 
Leipzig. 

R5-2, Spielminute 59:28 (Audio 28) 

Auch wieder was, was unsere Jungs vielleicht hierfür einstudiert ha- 
ben, das gefällt mir heut richtig gut. 

RS5-1, Spielminute 63:38 (Audio 29) 

Oh schade. (nach Torchance) 

R5-2, Spielminute 65:06 (Audio 30) 

Unsere Truppe funktioniert immer noch sehr sehr gut. (Bezogen auf mögliche 
Spielerwechsel) 


Bezogen auf die vom Leipziger Spieler Werner verspielte Torchance (Spielmi- 
nute 58:21) setzt das Fanradio Leipzig, anders als R1 (s. o.), den Fokus nicht auf 
den Fehler von Werner, sondern auf dessen Bemühungen, die an der Abwehrleis- 
tung der Bremer Mannschaft scheitern, und auf die Verbesserung des Leipziger 
Spielers Demme: 


R5-2, Spielminute 58:21 (Audio 31) 

Demme (Leipzig) hat Platz und er spielt den richtig genialen Ball auf 
Werner (Leipzig). Werner links im Strafraum. Werner muss nach innen 
ziehen. Werner versucht es direkt, versucht selbst zu schießen, 
aber da schmeißt sich Sané (Bremen)noch in den Ball und klärt für 
die Bremer. Richtig schöner, richtig guter Ball da von Demme wie- 
der Richtung Werner. Also Demme, er wird besser. 


Blindenreportage (R6) 

In der Blindenreportage rücken die Analyse und die Einordnung des Spielgesche- 
hens etwas in den Hintergrund. Oberste Priorität hat die Beschreibung spieleri- 
scher Details, vor allem der exakten Position des Balls; siehe hierzu auch die 
Selbstauskunft von R6-2: ,„ Verortung des Balles mit Meterangaben und markan- 
ten Punkten des Spielfeldes “. Durch Aussagen wie „Hört ihr die Zuschauerzahl? 
[...] Jawoll, danke, dass ihr da seid: 42.558“ (R6-2, Spielminute 63:47) wird 
Nähe zu den Fans erzeugt. Die Reporter signalisieren ein starkes Situationsbe- 
wusstsein für ihre Zielgruppe, indem sie Reaktionen im Stadion, die blinde Fans 
sonst nicht einordnen könnten, in ihrer Reportage erklären: 


R6-2, Spielminute 02:49 (Audio 32) 
Wen ihr gerade hört, das sind die Bremer Fans, die auch schön Stim- 
mung machen hier. 


R6-1, Spielminute 14:34 (Audio 33) 
Von der linken Seite Einwurf für Leipzig ungefähr 20 Meter vor der 
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Grundlinie. 

R6-1, Spielminute 14:49 (Audio 34) 

Gulacsi aus seinem Tor rausgelaufen ungefähr sieben, acht Meter 
zentral vor seinem Tor holt er den Ball mit beiden Händen runter und 
wirft ihn auf die rechte Seite ab. 

R6-3, Spielminute 46:15 (Audio 35) 

willi Orban, unser Innenverteidiger. Über die Mittellinie gelaufen, 
in den Mittelkreis, spielt nach rechts raus. Auf Demme, der ein 
bisschen Tempo anzieht. Auf die rechte Seite rausspielt, auf unsere 
Nummer drei, Bernardo, der mit Gnabry ins Duell geht. 

R6-2, Spielminute 63:12 (Audio 36) 

wir sind in der 64. Spielminute. (Liest von der Anzeigetafel ab:) 6:2 
Ecken für Leipzig. 

R6-2, Spielminute 63:47 (Audio 37) 

(Stadionsprecher verkündet die aktuelle Zuschauerzahl) Hört ihr die Zuschauerzahl? [..] 
Jawoll. Danke, dass ihr da seid: 52.558. 


Insgesamt zeigt sich als Tendenz: Je eindeutiger der emotionale und lokale Bezug 
zu einem Team ist, desto weniger objektiv ist die Berichterstattung. Dabei setzen 
die Reporter sprachlich den Fokus so, dass die Hörer*innen innerhalb kurzer Zeit 
einen Eindruck bekommen können, für welchen Sender und aus welcher Team- 
Perspektive gesprochen wird. Es können unterscheiden werden: 


- Nichtlokale Berichterstattung: Objektivierung dadurch, dass Hintergrund- 
informationen zu beiden Teams vermittelt werden, Wertungen zur Leistung 
beider Teams. 

- Lokale Berichterstattung: Fokus auf der Begegnung mit dem lokalen Ver- 
ein, Hintergrundinformationen und Wertungen überwiegend auf das lokale 
Team bezogen. 

- Fanradio-Berichterstattung: Starke Fokussierung auf das Spiel der jeweili- 
gen Mannschaft, Hintergrundinformationen in der Regel auf das eigene 
Team bezogen. 


6  Stimmlich-sprecherische Gestaltung der Fußballreportagen 


Das Sprechen in den untersuchten Fußballreportagen erscheint grundsätzlich sehr 
einheitlich: Weder hinsichtlich der Reportageform noch der Zielgruppe bzw. des 
Formats oder hinsichtlich der Sprecherpersönlichkeit zeigen sich deutliche Unter- 
schiede. Allerdings wird das Sprechen maßgeblich durch den Spielverlauf (Span- 
nungsphasen) beeinflusst. Die folgende Auflistung sprecherischer Kennzeichen 
basiert auf einer auditiv-phonetischen Analyse der Autor*innen. 
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6.1 Lautstärke, Sprechgeschwindigkeit und Artikulation 


Die Lautstärke der Reportagen ist durchschnittlich mittellaut bis sehr laut, dabei 
wechselnd in großem Umfang sowohl sprunghaft als auch gleitend. Die Laut- 
stärke der Reporterstimme folgt dem Spielverlauf, dabei können die Reporter pha- 
senweise ins Rufen bzw. Schreien übergehen. Dem liegt wohl auch die zuneh- 
mende Lautstärke im Stadion bei zunehmender Spielspannung zugrunde. Die 
Reporter gehen in ihrer Sprechlautstärke mit der Lautstärke im Stadion mit und 
übermitteln dadurch einen authentischen Eindruck von Spielverlauf und Stadion- 
atmosphäre. Erhöhte Lautstärke ist immer ein Anzeichen höherer Spielspannung. 
Das ist von den Reportern durchaus auch beabsichtigt, siehe bspw. die Selbstaus- 
kunft von R1: „Stimme steigern, um Spannung zu erzeugen und damit dem Hörer 
deutlich machen: Es wird gefährlich und er kann zu Hause mitzittern.“ 


Die Sprechgeschwindigkeit wechselt stark und ist abhängig von den Spielphasen, 
bspw. wird höhere Spielspannung übereinstimmend mit höherer Sprechgeschwin- 
digkeit angezeigt (es wird gleichsam der Eindruck des „Überschlagens der Ereig- 
nisse“ abgebildet). Typisch ist ein gleitender Anstieg der Sprechgeschwindigkeit 
bei Torannäherung. Dabei gibt es in der Regel ein Zusammenspiel von Sprechge- 
schwindigkeit, Lautstärke sowie Sprechtonhöhe bis zu einem Kulminationspunkt 
(bspw. Torerfolg, Ende einer Torchance), danach einen Abfall in den genannten 
Merkmalen. 


Alle Fußballreporter des Korpus zeichnen sich durch eine deutliche Artikulation 
aus, das gilt auch für Phasen hoher Sprechgeschwindigkeit. Typisch sind häufige 
Lautdehnungen. Sie können Anzeichen für erhöhten Sprechplanungsaufwand 
sein, aber auch dem Spannungsaufbau dienen (vgl. Abschnitt 7). 


6.2 Sprechpausen 


In den sechs Reportagen gibt es kaum Pausen. Die wenigen längeren Pausen in 
den untersuchten beiden Spielszenen liegen zumeist zwischen 0,5 und 1,0 s; die 
längste ist 1,4 s lang (siehe Transkript 2, Z. 28). In den Befragungen ging kein 
Reporter explizit auf die Pausensetzung ein. Die untersuchten Reportagen lassen 
allerdings vermuten, dass die Reporter ebenso wie Sprechgeschwindigkeit und 
Sprechtonhöhe auch Pausen als stilistisches Mittel einsetzen. 
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Atmosphärische Pausen 

Nach einer Torchance (bspw. Applaudieren der Fans) oder Torerzielung (Jubel 
der Fans) nutzen die Reporter Pausen, um den Zuhörer*innen am Radio die emo- 
tionale Atmosphäre im Stadion zugänglich zu machen, so dass diese sich viel- 
leicht sogar als Teil des Stadionpublikums fühlen können. Pausen nach Großchan- 
cen oder Toren, so kann der Autor aus eigener Erfahrung berichten, können auch 
als Auftakt bzw. Abgrenzungssignal für eine Nachschilderung dienen. Darüber 
hinaus nutzt der Autor solche Pausen gelegentlich, um selbst wieder „herunterzu- 
fahren“, nachdem er zuvor ein Maximum an Gespanntheit, Sprechtonhöhe, und 
Sprechgeschwindigkeit erreicht hatte. 


Illustriert wird das an zwei Ausschnitten aus den Reportagen 1 und 2, bezogen 
auf den gleichen Spielzeitpunkt — ab 04:48 (siehe Transkript 1 und 2; Konventio- 
nen nach GAT?2; SP = Spannungsphase; #...# = Spielminute). Beide Reporter (R1 
von der ARD und R2 vom Internetradio Sportl.fm) setzen nach einer vergebenen 
Großchance mehrfach längere Pausen, in denen die aufgeregte Stadionat- 
mosphäre gut zu hören ist. Zur Spielsituation: Leipzigs Stürmer Poulsen kommt 
allein vor Bremens Torhüter Wiedwald etwa acht Meter vor dem Tor zum Ab- 
schuss. Der Torhüter hält. 


IR1, Spielszene 1 (Audio 38) 

[SP4] # 04:48 # 

31 =WIEDwald HÄLT. 

H32 (1.0: Chance vorbei, aufgeregte Stimmung im Stadion) 
[SP1] # 04:50 # 

33 YUSsuf POULsen- 

34 =macht da BEIde INnenverteidiger NASS- 
[SP2] # 04:56 # 

H35 (0.8: aufgeregte Stimmung im Stadion) 
36 soWOHL (-) LAmin saNE- 

37 =als auch de:n FINnen niklas MOIsander- 


Transkript 1: Pausensetzung nach großer Torchance (R1) 


R1 stellt fest, dass die Großchance vorbei ist: „WIEDwald HÄLT.“ (Z. 31). Dann 
setzt er eine längere Pause (Z. 32: 1,0 s), bevor er mit der Nachschilderung beginnt 
(Z. 33-37). Innerhalb der Nachschilderung fügt R1 eine weitere längere Pause ein 
(Z. 35: 0,8 s). 


IR2, Spielszene 1 (Audio 39) 

[SP4] # 04:48 # 

24 der setzt sich DURCH- (höchstes Sprechtempo) 
[SP1] # 04:50 # 

25 °h und SCHEItert- 

L26 (0.6: aufgeregte Stimmung im Stadion) 
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27 AN felix WIEDwald. 
L28 (1.4: aufgeregte Stimmung im Stadion) 
29 das geht NICHT liebe bremer. 
[SP2] # 04:56 # 
L30 (0.9: aufgeregte Stimmung im Stadion) 
31 ihr dürft ihn natürlich da nicht LAU:fen lassen- 


Transkript 2: Pausensetzung nach großer Torchance (R2) 


R2 stellt ebenfalls fest, dass Poulsen scheitert (Z. 25). Dann folgt eine Pause (Z. 
26: 0,6 s), bevor er den Namen des Bremer Torhüters nennt (Z. 27). Die zweite 
längere Pause (Z. 28: 1,4 s) setzt er, bevor er die Bremer Verteidigung direkt an- 
spricht und ihre (Nicht-)Aktion bewertet (Z. 29-31). Innerhalb dieser Bewertung 
setzt er die dritte längere Pause (Z. 30: 0,9 s). 


Zu diesem Spielzeitpunkt (04:50) haben alle Reporter des Korpus eine Pause ge- 
setzt. Bei den anderen Reportern fielen die Pausen zwar kürzer aus (vgl. R6-1: 0,5 
s; R4: 0,4 s), sie leiten aber ebenso wie bei R1 und R2 eine Drosselung des Re- 
portage-Tempos ein und lassen die aufgeregte Stadionatmosphäre wirken. In der 
Reportage 5 fallen sich die beiden Reporter gegenseitig ins Wort, so dass keine 
Pause entsteht. 


Pausen zur Überbrückung von Spielunterbrechungen 

Längere Pausen werden in mehreren Reportagen zur Überbrückung von Spielun- 
terbrechungen genutzt; ihr Einsatz ist allerdings stark vom Reporter abhängig. In 
der Reportage 3 kommen gegen Ende des Spiels gehäuft Pausen ab etwa 0,5 Se- 
kunden Dauer vor. Zum Zeitpunkt des folgenden Spielausschnittes (Transkript 3) 
ist das Spiel ungewöhnlich lang unterbrochen (insgesamt 1 min 9 s). Der Reporter 
R3 überbrückt die Zeit bis zur Ausführung des vielleicht letzten richtigen Angriffs 
der Bremer. Seine Äußerungen enthalten Lautdehnungen (siehe Z. 39-40) und 
werden häufig durch Pausen unterbrochen (siehe Z. 40, 42, 44, 46, 47,48, 50). 


IR3, Spielszene 2 - Spielunterbrechung (Audio 40) 

[SP1] # 92:44 # 

-39 °h FREIstoß::- 

40 (0.7) nachdem DEMme sich wieder HOCHgerappelt hat::- 

41 FÜR den sv werder BREmen- 

+42 (1.0) und jetzt STEHen sie da hinten alle an der 
sechzehnMEterlinie- 

3 =an der STRAFraumkante. 

4 (0.7) letzte MöGlichkeit- 

5 

6 


=entweder IRgendein BREmer- 

(0.7) nimmt den ball mit_n KOPF und befördert ihn nach VORne 
oder ein LEIPziger- 

+47 (0.7) nimmt_n mit_n kopf und beFÖRdert ihn in die 
GEgenrichtung dann ist alles geLAU£fen. 
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48 (1.2) der freistoß ist noch NICHT geSPIELT- 
49 =HARTmann als KARtenspieler- 
-50 hat jetzt ZWEImal(.)gezeigt dass ER der wichtigste mann °h 
in der SCHLUSSphase ist- 
51 =der SCHIEDSrichter; 
52 RObert HARTmann- 


Transkript 3: Pausensetzung bei Spielunterbrechung (R3) 


In dieser Spielsituation wirken die Pausen durchaus spannungssteigernd. Der Re- 
porter gibt der aufgeheizten Stadionatmosphäre Raum. Möglicherweise will R3 
hier jedoch auch den Hörer*innen (und sich selbst) Momente der Entlastung ver- 
schaffen und eine Informationsüberfrachtung vermeiden, so wie R3 es im Frage- 
bogen angegeben hat: „Er [der Zuhörer] muss dich und das ganze Gerede auch 


‘ 


verstehen, er darf nicht überfrachtet werden mit Fakten, sonst ermüdet er.‘ 


Sprechplanungspausen und Häsitationen 

Kurze Pausen und Lautdehnungen innerhalb von Sprecheinheiten können als Zei- 
chen für erhöhten Sprechplanungsaufwand interpretiert werden. Möglicherweise 
verschaffen sich die Reporter damit Zeit, um Anschlussinformationen bzw. -for- 
mulierungen zu suchen. Das Transkript 4 enthält die Nachschilderung, die der 
Reporter R1 an die erste große Torchance des Spiels (vom Leipziger Spieler Poul- 
sen) anschließt. Sie weist mehrfach kurze Pausen sowie Lautdehnungen innerhalb 
von syntaktischen Einheiten auf (Z. 35, 38, 44, 46). 


R1, Spielszene 1 (Audio 41) 
[SP1] # 04:50 # 
32 (1.2) YUSsuf POULsen- 
33 =macht da BEIde INnenverteidiger NASS- 
[SP2] # 04:56 # 
34 (0.8) soWOHL (-) LAmin saNE- 
+35 =als auch de:n FINnen niklas MOIsander- 
36 =die KÖNN den DA nich HALten- 
37 der SETZT sich da gegen BEIde durch- 
+38 =da wird geZUPFT u:nd- 
39 das muss man yussuf poulsen auch zu GUte halten- 
40 =der lässt sich eben NICH fallen- 
()) 
43 =TOLle paRAde übrigens auch von felix WIEDwald- 
44 de:r den nach wie vor immer noch schwer verletzten 
an der HAND verletzten DRObny(.)verTRITT. 
[SP3] # 05:14 # 
45 =jetzt kommt LEIpzig schon WIEder- 
>46 ü:ber compPER- 
47 und über berNARdo den AUßenverteidiger- 


Transkript 4: Lautdehnungen und Sprechpausen als Indiz für Sprechplanungsaufwand (R1) 


© Frank & Timme Verlag für wissenschaftliche Literatur 265 


R1 rekapituliert, wie und gegen wen sich der Leipziger Poulsen durchgesetzt hat, 
und vermittelt den Hörer*innen so einen umfassenden Eindruck der Spielszene. 
Zunächst beschreibt er im historischen Präsens die abgelaufene Aktion von Poul- 
sen differenziert (Z. 32-38) und bewertet sie dann: „das muss man yussuf poulsen 
auch zu GUte halten- der lässt sich eben NICH fallen-“ (Z. 39-40). Wenig später 
bewertet R1 dann auch eine Spielhandlung des Bremer Torwarts Wiedwald als 
„TOLle paRAde“ (Z. 43) und gibt noch eine Hintergrund-Information: „de:r den 
nach wie vor immer noch schwer verletzten an der HAND verletzten DRObny (.) 
verTRITT“ (Z. 44). Diese Hintergrundinformation beginnt mit einer Lautdehnung 
(„de:r“), die kurze Pause vor dem abschließenden ,„(.) verTRITT“ ist möglicher- 
weise ein Indiz dafür, dass R1 das Wort nicht gleich einfällt. 

Lautdehnungen finden sich auch oft vor der Nennung von Namen; im Tran- 
skript 4 bspw. in Zeile 35 („als auch de:n FINnen niklas MOIsander-“) und in 
Zeile 46 („ü:ber compPER-“). 


Die Häufigkeit von Sprechplanungspausen variiert von Reporter zu Reporter 
stark, möglicherweise auch in Abhängigkeit von ihrer beruflichen Erfahrung. So 
weist die Reportage des zweitjüngsten Reporters R4 einen hohen Anteil von 
Sprechpausen innerhalb von Sprecheinheiten aus; siehe Transkript 5 (Zeilen 12, 
13, 14, 16). 


IRA, Spielszene 1 (Audio 42) 

[SP1] # 04:28 # 

-12 =der GING dann aber noch (-) Über den KASten (.) von (.) 
felix äh WIEDwald- 

-13 =dem KEEper vom sv (.) WERder BREmen- 

[SP2] # 04:36 # 

+14 =anSONSten die BREmer (.) spielen hier in den ersten paar 
minuten AUCH (.) munter MIT- 

15 sind aber noch NICH so RICHtig in die HÄLfte der bullen 

geKOMmen- 

>16 =also sie stehen (.) hier sehr komPAKT (.) die MANne 


Transkript 5: Gehäuftes Auftreten von Pausen innerhalb von Sprecheinheiten (R4) 


6.3  Sprechstimmlage und Melodieverlauf 


Die Sprechstimmlage der Reporter ist überwiegend mittelhoch bis sehr hoch, mit 
einem großen Tonhöhenumfang von mindestens einer Oktave bis zu einer None 
oder Dezime. Zwei Reporter (R1, R4) sprechen auch in ruhigen Spielphasen ge- 
spannt und hoch. Typische Melodieverläufe sind steigende Sprechmelodie in Ver- 
bindung mit steigender Spielspannung und fallende Sprechmelodie in Verbindung 
mit sinkender Spielspannung. 
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Melodieverlauf in ruhigeren Spielphasen (Spannungsphasen 1 bis 2) 

In den eher ruhig-beschreibenden Phasen bewegt sich die Sprechtonhöhe häufiger 
gleichförmig aufwärts und abwärts, allerdings gibt es auch Tonsprünge, vermut- 
lich im Dienst einer abwechslungsreichen, spannenden Schilderung. Im Tran- 
skript 6 sind die Tonsprünge des Reporters R2 in den Spannungsphasen 1 und 2 
durch Pfeile markiert (Zeilen 2, 3, 6, 8), rechts ist die durch den Tonhöhensprung 
erreichte maximale Sprechtonhöhe vermerkt. Die mittlere Sprechstimmhöhe von 
R2 liegt bei eher ruhigem Sprechen in den Spannungsphasen 1 und 2 bei E bis F. 


IR2, Spielszene 1 (Audio 43) 


[SP1] # 04:04 # Erreichte Tonhöhe 
01 WERder BREmen. 
02 °h +TOLle parTIE ((..)) ich FINde- H/c 
03 (0.5) DA: ist ne ŅGANze ganze menge drin- H 
04 =WERder (.) ist in den letzten wochen 


[SP2] # 04:11 # 
05 UNter alexander NOUri- 


06 +RICHtIig STARK geworden- B 
07 =in der +tAMTSzeit von(.)NOUri- e 
08 da holte WERder nur EInen punkt weniger als ++BAYern- c# 
09 (0.6) ALso da sach mir nochma bitte EIner- D# 


10 werder BREmen is_n ABstiegskandidat. 


Transkript 6: Tonhöhensprünge in den Spannungsphasen 1 und 2 (R1) 


In dieser Spielszene spielt R2 geradezu mit sprunghaften Tonhöhenveränderun- 
gen. Der Spielverlauf bewegt sich in den Spannungsphasen 1 und 2. Bis 04:11 ist 
der Ball nicht im Spiel, danach schlägt der Bremer Torhüter den Ball ins Mittel- 
feld, wo er dann bei den Bremer Spielern verbleibt, die allerdings keinen Angriff 
starten. Dies ist eine klassische Spielphase ohne Torannäherung, die der Reporter 
nutzt, um Hintergrundinformationen zu berichten (Z. 4-10). 


Melodieverlauf bei Torannäherung (Übergang zu den Spannungsphasen 3 und 4) 
Typischerweise steigt die Sprechtonhöhe bei Torannäherung gleitend bis zum 
höchsten Spannungspunkt an und fällt nach Ende einer Chance ohne Torerzielung 
schnell wieder. Ein Beispiel dafür findet sich in der Reportage 2 (03:42): Hier 
setzt sich der Leipziger Spieler Kaiser im Mittelfeld durch und schießt aus etwa 
zwanzig Metern aufs Tor. Der Ball geht rechts neben dem Tor vorbei. 


R2, Torchance durch Weitschuss (Audio 44) 
[SP3] # 03:39 # (deutliche Zunahme der Sprechgeschwindigkeit) 
01 <<acc> NOCH einmal im zenTRAlen beREICH-> 
E D# D# D# D# E D# DH E 
02 die LEIPziger- 
tG} G GĦ A 
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03 =DOMinik KAlser- 
GC AA A#H 

[SP4] # 03:41 # 

04 =zwanzig metTE\ |::R 

ce c# d# etıfııF 

[SP1] # 03:43 # 

05 (0.8) <<rall> RECHTS dran vor+B\EI> (1.6) 

F F# G#t dG 


Transkript 7: Stimmlicher Nachvollzug einer Spannungskurve bei Torchance (R2) 


Der Reporter R2 vollzieht die Spannungskurve des fliegenden Balles stimmlich 
nach: „DOMinik KAlser- zwanzig metTE\\::R“ (Z. 3—4; steigend-fallende Me- 
lodiebewegung auf dem Wort „Meter“ von d# bis F). Passend dazu, dass der Ball 
deutlich im Aus landen wird, beginnt R2 den Spannungs- und Tonhöhenabfall 
schon, während sich der Ball noch im Flug befindet. Obwohl die Torchance vor- 
bei ist, wiederholt R2 den Spannungsbogen noch einmal: „RECHTS dran 
vortB\EI“ (Z. 5), allerdings melodisch flacher und langsamer. 


Bewegt sich eine Mannschaft zum Tor (ab Spannungsphase 3), wird dies von den 
Reportern meist mit steigender Sprechtonhöhe und Sprechgeschwindigkeit dar- 
gestellt. Das Transkript 8 zeigt einen Ausschnitt aus der Reportage 1 (erste Spiel- 
szene, Spannungsphasen 3 und 4). Die mittlere Sprechstimmhöhe des Reporters 
R1 liegt im ruhigen Spiel bei G# bis A. In dieser Spielszene kommt der Leipziger 
Spieler Poulsen fast allein vor dem Bremer Tor zum Abschuss, nachdem er vorher 
einen Pass aus dem Mittelfeld bekommen hatte und sich gegen zwei Bremer Ver- 
teidiger durchsetzen konnte. Im Transkript 8 ist unter dem Wortlaut jeweils die 
Sprechtonhöhe der betreffenden Silbe angegeben. 


R1, Spielszene 1 (Audio 45) 
[SP3] # 04:45 # 
27 bei den ANgriffsbemühungen. 


A# H A A G# 
28 =jetz kommt LEIpzig schon WIEder mit POUlsen- 
A# H e d c# 


29 =gegen ZWEI- 
[SP4] # 04:48 # 
30 =POUlsen gegen ZWEI- 
dł} d dte f 
31 =gegen WIEDwald- 
d dł e Tonhöhensprung 
[SP1] # 04:50 # 
32 =WIEDwald HÄL:T. 
g g £f#ıc 


Transkript 8: Steigende Tonhöhenbewegung bei Torannäherung und Spannungsabfall (R1) 
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Zunächst spricht R1 mit kontinuierlich gleitender, steigender Sprechmelodie (Z. 
27-30); die ansteigende Spielspannung zeichnet er also mit dem Sprechtonhöhen- 
verlauf nach. Den höchsten Spannungspunkt setzt R1 in Zeile 31, verbunden mit 
dem einzigen Tonhöhensprung. Rasch erreicht er dann seinen Maximalton g (Z. 
32). Nach der Torchance (Zeile 32) sinkt seine Sprechtonhöhe gleitend auf dem 
Wort „HÄL:T“, verbunden mit einer Verringerung der Sprechgeschwindigkeit 
durch Lautdehnung. 


Das Transkript 9 veranschaulicht dieselbe Szene in der Reportage 2. Bei R2 ist 
ein stufenweiser Abfall der Sprechtonhöhe bis in seine Normalstimmlage zu ver- 
zeichnen (Z. 25 und 26): 


IR2, Spielszene 1 (Audio 46) 
[SP3] # 04:45 # 
22 die auch den ZWEIten ball bekommen können- 


A G# G F#F F E E E F# 
23 °h KÖPfen ihn in den LAUF von yussuf POULsen- 
1A A# tH tc td te d 


[SP4] # 04:48 # 
24 der SETZT sich <<Stimme bricht nach oben weg> DURCH>- 
d# f g g# 
[SP1] # 04:50 # 
25 °h und SCHEII|tert- 


g f# , H Stufe 1 
26 (0.8) AN felix WIEDwald. 
c HA# A GĦLF# Stufe 2 


Transkript 9: Steigende Tonhöhenbewegung bei Torannäherung und fallende Tonhöhenbewe- 
gung in zwei Stufen (R2), verbunden mit Spannungsabfall und Pausensetzung 


Unmittelbar nachdem klar ist, dass die Großchance nicht verwertet wurde, reali- 
sieren also beide Reporter (R1 und R2) den Spannungsabfall ganz ähnlich: Inner- 
halb einer Silbe fällt ihre Sprechstimmlage um eine Quarte bis Quinte. 


Melodieverlauf bei Spannungssteigerung ohne Torerfolg (Abschluss von 
Spannungsphase 4) 

Dieser Melodieverlauf ist typisch für besondere Spannungsmomente, bspw. Tor- 
chancen oder sonstige unerwartete Spielabläufe, die die Reporter als auffällig her- 
ausstellen. Beim Spannungsabfall treten häufig Lautdehnungen in Kombination 
mit einem fallenden Melodieverlaufauf. Als Beispiel dient ein Ausschnitt der Re- 
portage 5, in der es um einen Leipziger Doppelangriff geht: Zweimal kurz hinter- 
einander flankt Dominik Kaiser in den Bremer Strafraum (siehe Transkript 10). 
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IR5-1, Spielminute 58:57 (Audio 47) 
[SP3] # 58:57 # 
01 89, 
02 =FLANkenmöglichkeit von RECHTS. 
03 =KAlser bringt den REIN_nee; 
[SP2] # 59:00 # 
04 da is moiSANder daZWIschen- 
05 =Aber ball di!REKT! WIEder bei den LEIPzigern am FUB. 
[SP3] # 59:03 # 
06 =kein ABseits- 
07 =KAlser noch mal raus geSPIELT- 
[SP4] # 59:06 # 
08 °h FLANke sehr dicht aufs TO: :R- 
AcG 


[SP2] # 59:08 # 
09 =WIEDwald (.) HAT ihn- 


Transkript 10: Melodieverlauf und Lautdehnung bei Spannungsaufbau und -abfall ohne 
Torerfolg (R5-1) 


Unmittelbar vor diesem Ausschnitt war der Reporter R5-1 mit seinem Kollegen 
R5-2 in eine Nachschilderung bzw. Analyse einer vergangenen Szene vertieft. 
Diese beendet nun R5-1, indem er wieder auf das aktuelle Spielgeschehen ein- 
geht: „SO. FLANkenmöglichkeit von RECHTS. KAlser bringt den REIN-“ (Z. 1- 
3). Dominik Kaiser wird wiederholt auf der rechten Spielfeldseite unweit des 
Strafraums angespielt, erzielt aber jeweils keinen Torerfolg (bis Z. 7). Die erneute 
Großchance von Kaiser gestaltet R5-1 sprecherisch mit erhöhter Sprechspannung, 
einem melodischen Bogen und einer starken Vokaldehnung: „°h FLANke sehr 
dicht aufs TO::R “ (Z. 8). Im Wort „TO::R“ vollzieht der Reporter den Span- 
nungsverlauf des Spielgeschehens nach: Während sich der Ball Richtung Tor be- 
west, führt er die Sprechmelodie kontinuierlich nach oben. Als der Bremer Tor- 
hüter Wiedwald den Ball halten kann, lässt R5-1 die Tonhöhe abfallen und zeigt 
damit an, dass die Chance wiederum vertan ist: „WIEDwald (.) HAT ihn-“ (Z. 9). 


Melodieverlauf bei Torerfolg (Spannungsphase 5) 

Der Torerfolg wird häufig mit ekstatischem Rufen bis hin zum Schreien markiert, 
zumeist mit sehr großer Sprechspannung und Lautdehnung bei gleichbleibender 
Tonhöhe, siehe die Beispiele im Transkript 11: 
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Spielminute 41:17 (Audio 48) 

[SP3] # 04:45 # 

R1: KEIta mit dem <<schreiend> TO:::R> für LEIPzi:g 
g# g g# g# £f# f# fı b 


R5: geht vorBEI <<schreiend> JA:::> 
f# g g# a 


R6: KEIta macht das <<schreiend> TO: :R> 
a g g# g# g 
Transkript 11: Torrufe mit Lautdehnung in gleichbleibender Tonhöhe 


Anders als vielleicht zu erwarten, erreichen die meisten Reporter die höchste Ton- 
höhe nicht beim Torjubel. Sie bleiben etwa ein bis zwei Halbtöne unter der Ton- 
höhe, die sie bei anderen Großchancen (ohne Torerfolg) erreichen (siehe Tabelle 
6). 


Sprechstimmlage Höchste Tonhöhe Torjubel 
(ruhiges Spiel) (Großchance) 

R1 G# bis A g bis g# f bis f# 

R2 D# bis E g bis g# f bis f# 

R3 D# bis E a f# bis g 

R4 F# bis G g keine Torszene 
R5-1 |F bis F# g bis g# a 

R5-2 |F bis F# f# a 

R6-1 |F bis F# a g 


Tab. 6: Tonhöhen in den betrachteten Reportage-Ausschnitten 


Eine physiologische Erklärung dafür könnte sein, dass die betreffenden Reporter 
auf diese Weise dafür sorgen, dass ihre Stimme tragfähig bleibt und nicht nach 
oben wegbricht. Dass auch dies vorkommen kann, zeigt sich zum Beispiel in der 
Torszene mit Yussuf Poulsen (ab 04:45): Bei zwei Reportern (R2 und R6-1) bricht 
die Stimme in dieser Torszene nach oben weg. 
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7 


Sprachliche und sprecherische Gestaltung der Spannungs- 
phasen im Spielverlauf 


Aus der vorliegenden Untersuchung, eigener Erfahrung des Autors als Reporter 
und Gesprächen mit anderen Reportern lassen sich folgende Tendenzen für die 
sprachliche und sprecherische Gestaltung in Fußballreportagen ableiten: 


Was und auf welche Weise es gesagt wird, orientiert sich am Spielverlauf. 
Längere Planungsprozesse sind insbesondere während der Spannungspha- 
sen 3 bis 5 nicht möglich, daher wird in diesen Phasen spontan formuliert. 
In den ruhigen Spielphasen und in den Nachschilderungen entfalten Repor- 
ter*innen einen persönlichen Stil. 

In den spannenden Spielphasen greifen Reporter*innen auf gleiche Tech- 
niken („speaking dramatically“, vgl. Kern 2010, 233-234) zurück, was der 
stark begrenzten Zeit und dem klaren Spielfokus geschuldet ist. 


In der Auswertung der vorliegenden Reportagen wurde deutlich, dass die Eintei- 
lung der Spielszenen nach Spannungsphasen sich auch in der sprachlichen und 
sprecherischen Gestaltung der Reporter abbildet. 
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In den ruhigen Spielphasen 1 und 2, in denen sich der Ball nicht in Tornähe 
befindet, wechseln die Reporter mehrmals zwischen Aktions- und Neben- 
text: Der Reporter R2 bspw. streut Hintergrundinformationen ein (Spielmi- 
nute 01:16 bis 01:30; Audio 49): „Und die Leipziger überhaupt kommen 
auf der rechten Seite mit Bernardo |[...]. Spielt jetzt zurück ins Mittelfeld, 
sodass wir mal schauen können, was Werder gemacht hat nach dem 2:1 
Sieg gegen Bayer Leverkusen. “. Er reagiert prompt auf Spielsituationen 
und Publikumsreaktionen, bspw. wendet er sich nach dem deutlich wahr- 
nehmbaren Schiedsrichterpfiff und der darauffolgenden Zuschauerreaktion 
wieder dem aktuellen Geschehen zu: „Foulspiel von Clemens Fritz. Tief in 
der eigenen Hälfte. “. Er macht aber stimmlich-sprecherisch klar, dass wei- 
terhin keine Spannungssteigerung im Spielverlauf bevorsteht. 

Der Grad der emotionalen Beteiligung ist ab Spannungsphase 3 höher als 
in den Spannungsphasen 1 und 2, da die Möglichkeit einer Torerzielung 
näher rückt (Ball näher am Tor). Von nun an ist eine deutliche Verschie- 
bung vom sonstigen Text zum Aktionstext zu verzeichnen. In den relativ 
kurzen, aber spannungsgeladenen Phasen 3 bis 5 treten verkürzte Satzstruk- 
turen auf, verbunden mit einer intensivierten sprecherischen Gestaltung 
(Kombination aus erhöhter Sprechspannung, Lautstärke, Tonhöhe und 
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Sprechgeschwindigkeit). In der Spannungsphase 4 sprechen alle Reporter 
schnell bis sehr schnell. Die meisten Reporter haben zu Beginn von Span- 
nungsphase 4 bereits ihre maximale Geschwindigkeit erreicht, so dass in- 
nerhalb der Phase kein weiterer Anstieg verzeichnet werden kann. Der au- 
ditiv erlebbare stimmlich-sprecherische Spannungsbogen verläuft analog 
zum Spannungsbogen im Fußballspiel. Vor allem mit erhöhter Sprechge- 
schwindigkeit und einer flacheren Melodieführung mit ansteigender Ton- 
höhe zeigen die Reporter an, dass sich eine Mannschaft in einer aussichts- 
reichen Angriffssituation befindet. 

- Dagegen werden Nachschilderungen (bspw. nach einer Torchance) zwar 
häufig auch mit hoher Sprechspannung und Lautstärke, aber mit abnehmen- 
der Sprechgeschwindigkeit, sinkender Tonhöhe, bewegterem Melodiever- 
lauf und auch vermehrter Pausensetzung realisiert. 

- Inder Schlussphase der Partie nehmen bei allen Reportern die durchschnitt- 
liche Sprechspannung und Lautstärke zu. 


Der Orientierungspunkt für den Grad der emotionalen Beteiligung ist die angriffs- 
orientierte Ballbewegung ins gegnerische Verteidigungsdrittel. Kern (2010, 233- 
234) spricht auch vom „Switch Point“. Er ist auditiv ab Spannungsphase 3 mit 
dem Übergang von „elaborating“ zu „speaking dramatically“ (ebd.) auszu- 
machen. Ist ein Angriff abgeschlossen, bewegt sich der Ball im Mittelfeld oder ist 
gerade nicht im Spiel (bspw. Einwurf, Abstoß), sprechen die Reporter in der Re- 
gel weniger gespannt. 

Alle Reporter reagieren auf Veränderungen der Spielspannung in erstaunlicher 
zeitlicher Übereinstimmung. Die Abweichung zwischen den Reportern beträgt 
maximal zwei Sekunden (Übergang zur Spannungsphase 3) oder sogar nur eine 
Sekunde (Übergang zur Spannungsphase 4 und 5: Torchance und Torjubel). Le- 
diglich in einem Fall ist der Unterschied zwischen den Reportern im Übergang 
zur Spannungsphase 3 größer, bis zu vier Sekunden. Es handelt sich hierbei um 
eine Spielszene kurz vor Ende der Partie, beginnend etwa bei Spielminute 92:10. 
In der Spielszene können Kriterien für einen erhöhten Spannungsgrad gefunden 
werden!, die aber von den Reportern, möglicherweise auch aufgrund der Unüber- 
sichtlichkeit des Spielgeschehens, unterschiedlich interpretiert worden sind. 


! RB Leipzig gewinnt den Ball in der eigenen Hälfte. Dadurch, dass die Bremer weit in die 
Leipziger Hälfte aufgerückt sind, entsteht ein Konter. Der Spieler Keita wird über die linke 
Angriffsseite angespielt und hat nur wenige Gegenspieler vor sich. Da er ein schneller Spieler 
ist, ist zu erwarten, dass sich eine Torchance entwickeln kann. Allerdings befindet sich Keita 
fast an der Außenlinie und ist noch nicht ins Angriffsdrittel des Gegners vorgedrungen. Zudem 
ist nur ein weiterer Leipziger Spieler in der Nähe, sodass vermutet werden kann, dass Keita 
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Die im Vergleich zu den anderen Phasen selteneren Spannungsphasen 3 bis 5 sind 
für das Publikum im Stadion, die Hörer*innen vor dem Radio und die Reporter 
die interessantesten Spielabschnitte. Die Reporter ermöglichen den Hörer*innen 
ein authentisches Nachempfinden, indem sie die Spielspannung auch stimmlich- 
sprecherisch transportieren. Durch eine spannungsreiche, intensivierte Sprech- 
weise markieren die Reporter diese Phasen als besonders spielprägend, so dass 
Hörer*innen, die das Spiel im Radio nur „nebenbei“ verfolgen, das als Hinweis 
verstehen können, ihre Aufmerksamkeit der Reportage zuzuwenden. 


Exemplarisch dafür ist ein Ausschnitt aus der Reportage 5 (Audio 50). Die beiden 
Reporter R5-1 und R5-2 diskutieren ab Spielminute 50:11 über eine abgelaufene 
Spielszene und sind sich uneins über deren Bewertung. Als sich das Angriffsspiel 
der Leipziger wieder in das Angriffsdrittel des Gegners bewegt (Spannungsphase 
3), reagiert R5-2 prompt mit erhöhter Sprechspannung darauf: „Aber jetzt gehen 
wir mal rauf erst mal, was unsere Jungs da machen“ (Spielminute 50:24). Kurz 
darauf zieht die Sprechspannung noch einmal an, als R5-1 eine gerade abgelau- 
fene Aktion des Verteidigers Compper bewertet: „Aber Compper passt auf 
und...“ (50:45) und dabei von R5-2 unterbrochen wird, als sich der Ball wieder 
ins Angriffsdrittel der Leipziger bewegt: „So und Achtung jetzt wieder Pass, rein 
an den Strafraum“ (50:46). R5-2 lenkt damit den Fokus wieder auf das aktuelle 
Spielgeschehen (Spielbewegung von RB Leipzig in Richtung gegnerisches Tor). 
Was hier exemplarisch gezeigt wurde, gilt für beide Reporter über die gesamt Re- 
portage 5 hinweg. Sie differenzieren ihren Sprechstil in beiden Szenen gemäß den 
jeweiligen Spannungsphasen: 


- Spannungsphasen 1 und 2: Mehr oder weniger ruhiges Sprechen (häufig 
Erklärungen, Wertungen, Beschreibungen unabhängig vom Spielgesche- 
hen); gelegentlich hohe Sprechgeschwindigkeit, Silbendehnungen, starker 
und plötzlicher Melodieanstieg auf einzelnen Silben (Tonhöhensprünge). 

- Spannungsphase 3: Spannungssteigerung, Richtung der Aufmerksamkeit 
stärker auf das Spielgeschehen — oft nur kurz, dann wieder Rückkehr in 
ruhigere Haltung, wenn sich ein Angriff nicht ergibt; dem Spielverlauf fol- 
gend zunehmende Sprechspannung und Sprechgeschwindigkeit, flachere 


diesen Angriff möglicherweise lieber abbricht. Es finden sich in dieser Spielszene also Merk- 
male für einen Spannungsaufbau im Spiel, der allerdings nicht als eindeutig bezeichnet werden 
kann. Drei der fünf Reporter (R1, R2 und R3) reagierten stimmlich kaum auf das Anspiel von 
Keita und dessen Lauf in die gegnerische Spielfeldhälfte, während bei zwei Reportern (R5 und 
R6) bereits ein deutliches Anziehen der Stimme zu vernehmen ist. 
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Melodieführung, gelegentlich Silbendehnungen, Tonhöhen- und Lautstär- 
keanstieg. 

- Spannungsphase 4: Deutlich gespanntes Sprechen (Haltung: „Es kann je- 
den Moment etwas passieren... “), Torchance bahnt sich an - fortlaufende 
Zuspitzung des Sprechduktus (nochmals Steigerung von Tempo und Laut- 
stärke); Erreichen der höchsten Sprechgeschwindigkeit und Tonhöhe. 

- Spannungsphase 5: Höchste Emotionalität im Sprechen, Torjubel, Aus- 
rufe der Freude / Enttäuschung, langer ausgehaltener Rufton des Jubels 
(„Jaaaa‘“, „Toor‘“), längere Pausen — „Herunterfahren“ in die Nachschil- 
derung. 

- Nachschilderung: Emotionaler Nachvollzug einer Situation (Torerfolg, 
Schiedsrichter-Entscheidung, Großchance etc.) — Emotionalisierung ähn- 
lich dem Spannungsgrad der jeweiligen Szene; allmähliche Abnahme von 
Sprechgeschwindigkeit, Lautstärke und Tonhöhe. 


8 Exkurs: Fußballreportagen während der Covid19-Pandemie 
2020/21 


Von Mitte Mai 2020 bis Mitte Mai 2021 fanden die Spiele der Deutschen Fuß- 
ballprofi-Ligen fast ausschließlich ohne Zuschauer*innen statt. Für die Repor- 
ter*innen in den Stadien ergab sich so eine ungewohnte Situation. Es fehlte die 
Stimmung, die sonst durch die Zuschauer*innen maßgeblich miterzeugt wird. 
Vom Spielfeld waren die Anweisungen der Spieler und Verantwortlichen zu ver- 
nehmen, auf den Medientribünen hallten die Reportagen der Reporter*innen über 
leere Sitzschalen. 

Vorausblickend auf den Bundesliga-Restart nach der „Corona-Pause“ stellten 
sich Reporter*innen die Frage, wie eine Sportreportage ohne den murmelnden, 
applaudierenden, johlenden und schreienden Untergrund tausender Zu- 
schauer*innen zu sprechen ist. Der Sportchef des Autors gab folgende Anweisun- 
gen für die anstehenden Reportagen: Der lang anhaltende Tor-Rufbei Torerfolgen 
solle vermieden werden, man solle vorsichtig mit überemotionaler und zu eupho- 
rischer Berichterstattung sein, dennoch sollten die Reportagen aber nicht langwei- 
lig oder zurückgenommen wirken. 


Nach der Erfahrung des Autors hat sich der Sprechstil der Fußball-Berichterstat- 
tung ohne Stadionpublikum verändert. Wenn die Stimmungsäußerungen der Zu- 
schauer*innen, die die Spannung und den Rhythmus eines Spiels widerspiegeln 
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und so die Reportage mitsteuern, fehlen, kann sich der Reporter nur am Ballge- 
schehen auf dem Rasen orientieren. Einen stimmlich-sprecherischen Spannungs- 
bogen zu erzeugen fällt so deutlich schwerer. Außerdem ist der Reporter viel stär- 
ker als Experte bei der Einschätzung von Situationen gefordert, die ansonsten die 
Zuschauer*innen auf eine gewisse Art und Weise vorgeben. Wenn beispielsweise 
eine Schiedsrichter-Entscheidung für einen Großteil der Zuschauer*innen frag- 
würdig erscheint, muss der Reporter dies thematisieren. Wenn kein Stadionpubli- 
kum da ist, kann es passieren, dass der Reporter keinen Anlass sieht, darüber zu 
sprechen. Hieran wird deutlich, dass Fußball-Reporter*innen im Radio normaler- 
weise nicht nur als Vermittler*innen des Spielgeschehens gefordert sind, sondern 
auch als Teil des Stadionpublikums. 

Insgesamt wirken die Spiele weniger spannend als mit Zuschauer*innen. In- 
zwischen beobachtet der Autor bei sich und anderen aber einen gewissen Gewöh- 
nungseffekt, der die „Euphorie-Bremse‘“ vom Anfang der Pandemie lockert: Die 
Unterschiede im Sprechen von Fußballreportagen mit versus ohne Zuschauer*in- 
nen erscheinen nicht mehr ganz so groß. Das gilt vor allem für Melodieführung, 
Pausensetzung, Sprechspannung und Sprechtonhöhe. Allerdings ist die Tendenz 
zum Rufen deutlich geringer, Torjubel fallen zurückhaltender aus. 


9 Fazit 


Es liegt nahe, die sprachliche und sprecherische Gestaltung in Fußballreportagen 
als genrespezifisch zu klassifizieren. Mittels sprachlicher sowie stimmlich-spre- 
cherischer Dynamik erfüllen die Reporter die an sie gerichtete journalistische 
Aufgabe einer (Live)-Reportage. Die Ergebnisse der Reporter-Befragung lassen 
zudem auf ein hohes Zielgruppenbewusstsein schließen. Indem die Reporter ihr 
Sprechen und ihre Sprache an die Dynamik des Spielgeschehens anpassen, geben 
sie den Hörer*innen eine Orientierung im Spiel. Untersuchungen zu Fußballre- 
portagen müssen deshalb zwingend unter Beachtung des jeweiligen Spielgesche- 
hens durchgeführt werden — und, wie die Pandemie-Erfahrung zeigt, auch unter 
Beachtung des jeweiligen Stimmungsbeitrags des Stadionpublikums. Die Eintei- 
lung eines Fußballspiels in Spannungsphasen stellt eine Möglichkeit der Substili- 
sierung von Sprach- und Sprechstil(en) in Fußballreportagen dar. 

Es konnte gezeigt werden, dass die Reporter auf bestimmte Veränderungen im 
Spielverlauf fast zeitgleich und gleichermaßen reagieren. Aus den gut vergleich- 
baren sechs Reportagen im Korpus lässt sich ableiten, dass die Reporter systema- 
tisch zwischen einem eher sachlichen Stil in ruhigen Spielphasen, einem emotio- 
nalisierten Stil in spannungsreichen Spielphasen und Nachschilderungen 
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unterscheiden und spielbezogen wechseln. In der Untersuchung fanden sich auch 
Anhaltspunkte für das systematische, vermutlich ganz bewusste Spiel der Repor- 
ter mit ihrer Stimme. Dabei konnten reporterspezifische Präferenzen auditiv er- 
fasst werden, die sich beispielsweise in der melodischen Gestaltung oder in cha- 
rakteristischen Tonsprüngen äußern. Die vergleichende Untersuchung legt den 
Schluss nahe, dass in Fußballreportagen nach erworbenen genretypischen Mus- 
tern agiert wird, die durch individuelle Nuancen modifiziert werden. Je nach Ziel- 
publikum und Senderformat zeigen sich Unterschiede in der inhaltlichen Fokus- 
sierung und sprachlichen Gestaltung der Reportagen. 
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Vorlesen versus freies Sprechen im Hörbuch 


Anne Nieper, Ravensburg 


Das Hörbuch ist ein faszinierendes Medium, welches sich einer wachsenden 
Beliebtheit erfreut. Inhaltlich zeichnet sich die deutsche Hörbuchlandschaft durch 
eine große Diversität aus: Von Belletristik und Lyrik, über Sachliteratur und Rat- 
geber, bis hin zu Sprachkursen existiert ein breites Angebot an Produktionen, wel- 
che unter der Bezeichnung Hörbuch vertrieben werden. Hinsichtlich der spreche- 
rischen Produktionsweise dominiert jedoch eine Form des Hörbuchs den 
deutschen Hörbuchmarkt: das vorgelesene Hörbuch. Aus diesem Grund wird im 
Alltag häufig der Begriff des Hörbuchs mit dem vorgelesenen Hörbuch gleichge- 
setzt. Gleichzeitig existieren jedoch einige wenige Produktionen, welche andere 
sprecherische Produktionsweisen als das Vorlesen aufweisen und durch diese Be- 
sonderheit aus der Masse der vorgelesenen Hörbücher hervorstechen. Zu diesen 
Sonderformen des Hörbuchsprechens zählt auch das freie Sprechen. 


Ziel dieses Artikels ist es, das freie Sprechen im Hörbuch als Alternative zum 
Vorlesen zu beschreiben. Dazu werden Charakteristika des Vorlesens als domi- 
nierende Form des Hörbuchsprechens und des freien Sprechens als Sonderfall im 
Hörbuch dargelegt und miteinander verglichen. Zudem wird ein prominentes Bei- 
spiel für freies Hörbuchsprechen vorgestellt, um die theoretischen Erkenntnisse 
zu veranschaulichen. Bei dem Beispiel handelt es sich um eine Hörbuchaufnahme 
des österreichischen Autors, Musikers und Hörbuchsprechers Michael Köhl- 
meier, der mit seinen frei gesprochenen Hörbuchproduktionen große Bekanntheit 
erlangte und ein beinahe einzigartiges Phänomen auf dem Hörbuchmarkt darstellt. 


1 _ Vorlesen im Hörbuch als häufigste Produktionsform 


Vorgelesene Hörbücher basieren auf einem bereits schriftlich existierenden Text, 
welcher von einem bzw. einer oder mehreren Sprecher*innen eingesprochen wird 


© Frank & Timme Verlag für wissenschaftliche Literatur 279 


(vgl. Häusermann 2010a, 13-14). Der eingesprochene Hör-Text kann beispiels- 
weise eine für das Hörbuch adaptierte Version eines bereits existierenden zumeist 
literarischen Werkes sein. In der Regel ist der Hör-Text in diesen Fällen stark an 
den Originaltext angelehnt und wird häufig lediglich gekürzt. Allerdings existieren 
auch vorgelesene Hörbuchproduktionen, für die eigens ein neuer Text geschrieben 
wurde (vgl. Heudecker 2006, 84). Das Vorhandensein einer schriftlich fixierten 
Textvorlage und die Nähe zum Originaltext spiegeln sich auch in der sprecheri- 
schen Produktionsweise von Lesungen wider, dem Vorlesen. Im Gegensatz zu an- 
deren sprecherischen Produktionsweisen, wie beispielsweise Rezitieren, Dekla- 
mieren und Zitieren, welche im Zusammenhang mit der sprecherischen Tätigkeit 
in künstlerischen Kontexten häufig genannt werden und ebenfalls einen vorgege- 
benen Text zur Vorlage haben, setzt das Vorlesen im Moment seines Vollzugs eine 
schriftlich fixierte Vorlage (z. B. eine Buchvorlagen oder ein ausformuliertes Ma- 
nuskript) voraus, die 1:1 sprecherisch realisiert wird. Müller (2007, 26) schreibt 
dazu: „Das Vorlesen ist sichtbar dem physisch anwesenden Buch verpflichtet, das 
Rezitieren, auch wenn es auswendig erfolgt, seiner virtuellen Anwesenheit“. Das 
Rezitieren setzt demnach zwar wie das Vorlesen eine vorgegebene Textvorlage 
voraus; diese kann allerdings auch auswendig vorgetragen werden. 


Wenn ein Sprecher oder eine Sprecherin einen bereits schriftlich vorliegenden 
Text wiedergibt, bezeichnet Häusermann (vgl. 2010b, 191) dies als reproduzie- 
rendes Sprechen. Auch in der sprechwissenschaftlichen Definition des Vorlesens 
von Ockel (2004, 84) steht in erster Linie „die sprecherische Vermittlung des Ge- 
lesenen[...] für einen oder mehrere Hörer“ beim Vorlesen im Vordergrund. Ockel 
fügt dem Vorlesen jedoch eine weitere Dimension hinzu, da die Sprecher*innen 
den Zuhörer*innen beim Vorlesen „die eigene Leserbegegnung mit dem Text 
[mitteilen]“ (ebd.). Dieser Zusatz beinhaltet einen interpretierenden Aspekt des 
Vorlesens, der die Auseinandersetzung der Sprecher*innen mit dem Text voraus- 
setzt und sich in der sprecherischen Realisierung der Textvorlage äußert. Somit 
wird in dieser Hinsicht unter Vorlesen nicht nur die reine mündliche Wiedergabe 
und Vermittlung geschriebener Sprache und damit reproduzierendes Sprechen 
verstanden, sondern auch eine Form des textinterpretierenden bzw. gestaltenden 
Sprechens. Gutenberg (2005, 377) fasst diese beiden Aspekte des Vorlesens in 
folgender Definition zusammen: 


„In der Sprechwissenschaft gilt Vorlesen als eine Form des reproduzierenden Sprech- 
denkens: ein Prozess, bei dem eine adäquate Schallform (Schwereabstufung, Kaden- 
zierung, Gliederung) für eine gegebene Schallform (Text) entwickelt wird, sodass 
eine Sinnintention ausgedrückt werden kann, für die diese Textgestalt möglich ist.“ 
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Handelt es sich bei den Textvorlagen um künstlerische Texte, verschafft dieser 
zusätzliche interpretierende Aspekt auch dem Vorlesen einen künstlerischen Cha- 
rakter. In diesem Sinne versteht Travkina (2010, 12) das Vorlesen im Hörbuch als 
„die künstlerisch interpretierende und reproduzierende Tätigkeit des Sprechers ei- 
nes literarischen Textes“. Eine bewusste künstlerische Interpretation beim Vorle- 
sen kann nur vollzogen werden, wenn sich die Sprechenden im Vorfeld des spre- 
cherischen Ereignisses mit dem Text auseinandergesetzt haben. Dadurch kann 
sich der Sprecher oder die Sprecherin vor dem Ereignis mit dem Text vertraut 
machen und eine Sprechfassung entwickeln, wie Neuber (vgl. 2004, 200) es in 
den Erarbeitungsphasen einer künstlerischen Sprechfassung beschreibt (Erstre- 
zeption, rezeptive und rezeptiv-produktive Aneignung und eigentlicher Vortrag). 
Somit ist den Sprecher*innen im Vorfeld der sprecherischen Realisation die in- 
haltliche und sprachliche Gestalt der Textvorlage und, nach der Aneignung und 
Erarbeitung, auch die sprecherische Gestalt des Hör-Textes bewusst. Während 
des Sprechens wird somit „der Gedanke [...] im Bewusstsein seiner Bekanntheit 
wiedergegeben“ (Häusermann 2010b, 191). Für Produktionen vorgelesener Hör- 
bücher bedeutet dies, dass den Sprecher*innen in der Regel im Vorfeld der Stu- 
dioaufnahme die Textvorlage zugeschickt wird. Die Sprechenden kennen also die 
inhaltlichen, strukturellen und sprachlichen Eigenschaften des Textes und können 
sich zusätzlich über die Entstehung und Inhalte des Textes informieren. Anhand 
all dieser Informationen erarbeiten sie eine Haltung zum Text sowie darauf auf- 
bauend eine Sprechfassung. In ihrer Interpretation sind Vorleser*innen nicht 
komplett frei, da das Vorhandensein einer Textvorlage eine enge Bindung der 
sprecherischen Realisation daran zur Folge hat. Dabei stellt die Textvorlage be- 
züglich ihrer genrespezifischen und genreübergreifenden Merkmale bestimmte 
Anforderungen an das Sprechen. So existieren beispielsweise unterschiedliche 
Anforderungen an das Sprechen, je nachdem aus welcher literarischen Gattung 
der Text stammt; zu den als genreübergreifenden Aspekten zählen Merkmale wie 
Interpunktion, syntaktische Struktur und zusätzliche Sprecheranweisungen. Als 
problematisch kann sich vor allem erweisen, dass die schriftlich ausformulierten 
Hör-Texte häufig komplexe, schriftsprachliche Strukturen aufweisen, welche 
nicht im Hinblick auf eine ausgeprägte Hörerverständlichkeit konzipiert wurden. 
Laut Gutenberg (1998; 2001) kann das auch zu einer sprecherischen Gestaltung 
führen, die nicht dem Sinn der Sprachform entspricht und damit die Hörverständ- 
lichkeit verringert. Geißner und Wachtel (2003, 195) fordern daher: „Wer Hör- 
verständlichkeit erreichen möchte, sollte sprechdenken können, das heißt keine 
vorformulierten oder auswendig gelernten Sätze reproduzieren, sondern die Ge- 
danken in der konkreten Situation vor den Hörern und für sie im Sprechen neu 
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entwickeln“. Da dies beim Vorlesen eines schriftlich vorgefassten Texts nicht 
möglich ist, müssen Sprecher*innen von vorgelesenen Hörbüchern diese Heraus- 
forderung anders bewältigen. 

Die potentiell verminderte Hörverständlichkeit beim Vorlesen ist jedoch kein 
hörbuchspezifisches Problem. Auch im deutschen Hörfunk ist das Vorlesen von 
ausformulierten Texten, beispielweise von Nachrichtentexten, die übliche spre- 
cherische Produktionsweise, worunter mitunter die Hörverständlichkeit leidet 
(vgl. z. B. Tietge 2009, Apel 2018, Schwenke 2020). Tietge (2009) untersuchte 
daraufhin in einer Fallstudie, inwiefern das Sprechen anhand eines Stichwortzet- 
tels die Hörverständlichkeit der Nachrichten verbesserte. Diese alternative Mög- 
lichkeit ist Sprecher*innen von vorgelesenen Hörbüchern, die sich zumeist sehr 
nahe an originalen Textvorlagen und deren Formulierungen orientieren, nicht ge- 
geben. Die Sprecher*innen stehen demnach vor der großen Herausforderung, den 
Text hörerverständlich zu präsentieren, ohne ihn strukturell verändern zu dürfen. 


2 Freies Sprechen im Hörbuch als Alternative zum Vorlesen 


Neben den überwiegend auf einer schriftlich fixierten Textvorlage basierenden 
Hörbuchproduktionen existieren auch einige wenige Produktionen, welche ohne 
einen im Vorfeld der Aufnahme ausformulierten Text produziert werden. Diese 
Produktionen werden im Folgenden als frei gesprochene Hörbücher bezeichnet. 
Wie bereits festgestellt wurde, bilden frei gesprochene Hörbücher im Hörbuch- 
segment momentan eher eine Ausnahme. Generell ist das freie Sprechen in den 
Medien ein eher seltenes Phänomen. Radio- und Fernsehproduktionen basieren in 
der Regel auf Manuskripten, welche vorgelesen werden. Interessant ist, dass in 
bestimmten Situationen versucht wird, die Anmutung des freien Sprechens vor 
dem Mikrofon zu erzeugen. So stellt Tolson (2006) an inszeniertes, auf Skripten 
basierendes Sprechen in den Medien gewisse Anforderungen, zu denen auch das 
Konzept der Liveliness zählt. Darunter versteht Tolson (vgl. ebd., 11-14) rheto- 
rische Eigenschaften, die den Eindruck bei den Hörer*innen hervorrufen, dass das 
Gesprochene im Moment spontan entsteht und frei formuliert wird. Medienspre- 
chen soll nichts von seiner schriftlichen Grundlage erahnen lassen. Stattdessen 
soll es als spontan formulierte Äußerungen wahrgenommen werden, so wie es in 
Alltagsgesprächen der Fall ist. Diese künstlich hergestellte Spontaneität, welche 
Tolson für Mediengespräche fordert, führt der Autor auf ein gewisses Bedürfnis 
nach der Lebendigkeit freien Sprechens in den Medien erkennen. Interessant ist 
daher, wie das Mediensprechen, das tatsächlich frei stattfindet, konkret im Hör- 
buch vollzogen wird. 
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Allen Situationen, in denen frei gesprochen wird, ist gemein, dass die Sprechen- 
den ihre Äußerungen erst im Moment des Sprechens ausformulieren. Die Erschaf- 
fung des Hör-Textes fällt zeitgleich mit der mündlichen Aufführung zusammen 
(vgl. Janz-Peschke 2010, 332). Das freie Sprechen unterscheidet sich daher vom 
Vorlesen hinsichtlich der Entstehungsprozesse des Gesprochenen. Dies betrifft 
vornehmlich die Entstehung des Wortlauts und damit den Wortlaut selbst, wel- 
cher beim Vorlesen bereits im Vorfeld des Sprechens festgelegt ist, beim freien 
Sprechen dagegen erst während des Sprechens entsteht (vgl. Stock 1996, 81). So 
ist auch bei einem frei gesprochenen Hörbuch der Hör-Text eigens für die Audio- 
Aufzeichnung konzipiert und wird ohne Vorlage oder Manuskript eingesprochen 
(vgl. Binczek 2012, 60). Insofern können Sprecher*innen frei gesprochener Hör- 
bücher anders als bei vorgelesenen Hörbüchern im Vorfeld keine konkrete 
Sprechfassung erarbeiten, da es keine feststehende sprachliche Vorlage gibt. Die 
Sprecher*innen sind nicht an die genretypischen und genreübergreifenden Merk- 
male eines Textes bei der sprecherischen Realisation gebunden. Stattdessen ste- 
hen sie vor der Herausforderung, keinerlei Vorlage zu haben und somit die eige- 
nen Gedanken im Moment des Sprechens auszuformulieren und zu gestalten. 


Entstehen Hör-Texte wie beim frei gesprochenen Hörbuch erst während des Spre- 
chens, bezeichnet Häusermann (vgl. 2010b, 191) dies als produzierendes Spre- 
chen, welches im Gegensatz zum reproduzierenden Sprechen einer ausformulier- 
ten Textvorlage steht. Dadurch, dass beim produzierenden Sprechen nicht bereits 
Vorformuliertes wiedergegeben wird, kann in diesem Zusammenhang auch vom 
freien Formulieren der Gedanken gesprochen werden. Frei formulierte Äußerun- 
gen sind somit das Ergebnis von sogenannten Sprechdenkprozessen. Dies bedeu- 
tet, dass die Gedanken beim freien Sprechen im Gegensatz zum Vorlesen erst mit 
dem Aussprechen verfertigt werden (vgl. u. a. Pabst-Weinschenk 2004, 63-66). 
Dadurch ist der Prozess des Sprechdenkens ein komplexer und sehr störungsan- 
fälliger Vorgang. Auf die einzelnen Phasen des Sprechdenkprozesses soll an die- 
ser Stelle nicht ausführlich eingegangen werden; verschiedene Modelle zum Ab- 
lauf des Sprechdenkens von der Planung bis zum Sprechen wurden u. a. von 
Drach (1926), Winkler (1954), Levelt (1989), Barthel (1992) und Gutenberg 
(2001) entwickelt. Die Schwierigkeiten liegen in der Kompliziertheit der Herstel- 
lung des inneren sprachlichen Konzepts sowie der „Gleichzeitigkeit von Konzep- 
tentwicklung und artikulatorischer Ausführung“ (Stock 1996, 81). Denken und 
Sprechen verlaufen demnach häufig parallel, sodass die Gedanken noch nicht 
vollständig im Kopf ausformuliert sind, bevor mit dem Sprechen begonnen wird 
(vgl. Pabst-Weinschenk 2004, 67). Die Vollendung der Gedanken findet erst im 
Moment des Sprechens statt. Das hat Heinrich von Kleist bereits 1805 als „Die 
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allmähliche Verfertigung der Gedanken beim Reden“ bezeichnet. Der Sprech- 
denkprozess fordert in seiner Konzeptualisierung und Kodierung von frei formu- 
lierten Äußerungen Zeit (vgl. Kleist 1805). Spricht ein Sprecher bzw. eine Spre- 
cherin beispielsweise schneller als der Sprechdenkprozess verläuft, kommt es zu 
Stockungen, Verzögerungen, Versprechern oder Pausen, die z. T. mit Verzöge- 
rungspartikeln gefüllt werden (vgl. ebd.). Anders als beim reproduzierenden Spre- 
chen, bei dem bereits Ausformuliertes Wort für Wort wiedergegeben wird und 
damit der Formulierungsprozess wegfällt, wird beim produzierenden Sprechen 
demnach die klangliche Gestalt der Äußerungen nicht nur durch die inhaltlichen 
und strukturalen Eigenschaften des Sprechtextes geprägt, sondern auch durch die 
an die Konzeptualisierung und Kodierung gekoppelten Formulierungsprozesse. 


3 Erzählen als Form des freien Sprechens 


Wie bereits erwähnt, findet das freie Sprechen in unterschiedlichen Situationen 
statt und kann daher diverse Formen annehmen. Im Folgenden soll auf eine Form 
des freien Sprechens eingegangen werden, welche im Zusammenhang mit Pro- 
duktionen frei gesprochener Hörbücher häufig erwähnt wird: das Erzählen. Damit 
ist in diesem Zusammenhang nicht die literarische Gattung der Erzählung gemeint 
und auch nicht die Grundhaltung in epischen Texten. Unter Erzählen wird in die- 
sem Fall die sprecherische Produktionsweise bzw. die sprachliche kommunika- 
tive Handlung in ihrer mündlichen Form verstanden (vgl. Becker / Stude 2017, 
1). Das mündliche Erzählen kann unterschiedliche Formen annehmen. Allgemein 
formuliert ist eine Erzählung die Darstellung eines singulären Sachverhaltes, wo- 
bei die dazugehörigen Ereignisse chronologisch geordnet und räumlich, zeitlich 
und kausal aufeinander bezogen dargestellt werden (vgl. Martinez 2017, 2). Ein 
wesentliches Merkmal des Erzählens ist, dass es sich dabei um eine sogenannte 
übersatzmäßige Diskurseinheit handelt, was bedeutet, dass das Erzählen mehr als 
nur eine Äußerung umfasst (vgl. Becker / Stude 2017, 6). Im Gegensatz zu ande- 
ren Formen des freien Sprechens wird beim Erzählen die emotionale Einbezie- 
hung der Zuhörer*innen angestrebt, welche durch unterschiedliche inhaltliche, 
aber auch sprecherische Mittel erreicht werden kann. Damit weist das Erzählen 
subjektive und emotionale Züge auf (vgl. ebd., 10). Durch diese Eigenschaft eig- 
net sich das Erzählen besonders für das freie Sprechen in künstlerischen Kontex- 
ten wie dem Hörbuch. 
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Für die vorliegende Auseinandersetzung mit dem Erzählen im Hörbuch ist in ers- 
ter Linie die Abgrenzung des professionellen künstlerischen Erzählens vom all- 
täglichen Erzählen wichtig (vgl. Merz 2014, 13). Erzählen ist zwar ein alltägliches 
Phänomen, doch das professionelle künstlerische Erzählen beherrscht nicht jeder: 
„Der Erzähler, der vor einem Publikum erzählt, positioniert sich zwischen ihm 
und der Kunst.“ Wardetzky (2007, 41 £.). Wie bei anderen sprecherischen Reali- 
sierungsformen in künstlerischen Kontexten ist das Ziel auch beim künstlerischen 
Erzählen, den Zuhörer*innen den Inhalt durch das bewusst gestaltete, künstleri- 
sche Wort zu vermitteln. Beim künstlerischen Erzählen als Form des freien Spre- 
chens wird diese bewusste Gestaltung jedoch dadurch erschwert, dass es keine 
feststehende Textvorlage gibt und der Hör-Text erst im Moment des Sprechens 
entsteht. Auf die Herausforderungen der dabei stattfindenden Sprechdenkpro- 
zesse wurde bereits hingewiesen. 


Professionelle Erzähler*innen erstaunen jedoch mit ihrer flüssigen Erzählweise 
und ihrem scheinbar grenzenlosen Gedächtnisvermögen (vgl. Janz-Peschke 2010, 
334). Sie scheinen sich ihrer Sprechdenk- und Formulierungsprozesse bewusst zu 
sein, sodass es viel weniger zu den sonst so typischen sprachlichen und spreche- 
rischen Phänomenen des freien Sprechens (wie Umplanungen, Versprecher, Zö- 
gerungen usw.) kommt. Wardetzky (2007, 48) geht dabei noch einen Schritt wei- 
ter, indem sie professionellen Erzähler*innen die Fähigkeit zuspricht „Oralität 
und Literalität miteinander in ein ausbalanciertes Verhältnis [...] bringen [zu kön- 
nen]“. Demnach vermeiden professionelle Erzähler*innen alltagssprachliche oder 
umgangssprachliche Wendungen, ohne jedoch dabei die Mündlichkeit und Le- 
bendigkeit des Erzählens zu verlieren. Somit scheinen beim künstlerischen Erzäh- 
len die Grenzen zwischen Mündlichkeit und Schriftlichkeit zu verschwimmen. 
Die Ursachen für die beeindruckenden sprecherischen Leistungen künstlerischer 
Erzähler*innen sind vielschichtig. Zunächst sei diesbezüglich festgehalten, dass 
das professionelle künstlerische Erzählen ein langwährender Übungsprozess ist. 
Da es keine Ausbildung zum Erzähler gibt, können die Fertigkeiten des künstle- 
rischen Erzählens nur durch das Erzählen an sich erworben werden, gemäß dem 
Motto: learning by doing (vgl. ebd., 32). Erfahrene Erzähler*innen bilden ihr 
Können somit über Jahre aus und haben dementsprechend viel Übung. Zudem 
kann als wichtiger Grund für die erstaunliche Erzählleistung professioneller Er- 
zähler*innen angesehen werden, dass sie sich beim künstlerischen Erzählen, an- 
ders als beim alltäglichen Erzählen, im Vorfeld ihrer Darbietungen wie andere 
Sprechkünstler*innen intensiv mit dem jeweiligen Inhalt und ihrer Erzählsituation 
auseinandersetzen. Merz (2014, 14) formuliert dies wie folgt: „Der Erzähler ar- 
beitet [...] nicht willkürlich, sondern passt Inhalt und Darstellungsweise an die 
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gegebenen historischen, sozialen und persönlichen Umstände an“. So beziehen 
Erzähler*innen auch ihr Wissen um ihre Hörerschaft in ihre Vorbereitung mit ein 
(vgl. ebd., 20). Damit weist die Vorbereitung auf das künstlerische Erzählen Pa- 
rallelen zu den Einflussfaktoren für die Erarbeitung einer reproduzierten künstle- 
rischen Sprechfassung auf (vgl. Neuber 2004, 200: Sprecher*in (innere und äu- 
Bere Situation), Hörer*in (innere und äußere Situation), Werk/Text, Realisations- 
form). 


In Anbetracht des letztgenannten Aspekts könnte daher diskutiert werden, inwie- 
fern es sich beim künstlerischen Erzählen überhaupt um eine Form des freien 
Sprechens bzw. um rein produzierendes Sprechen im Sinne von spontaner Münd- 
lichkeit handelt, wie in den meisten Fällen des alltäglichen Erzählens, oder ob das 
künstlerische Erzählen auch reproduzierende Züge wie das Vorlesen oder Schau- 
spielen aufweist. Denn in der Regel wird nacherzählt statt neu erzählt und meist 
dient ein bereits schriftlich fixierter Text als inhaltliche Vorlage für die mündliche 
Erzählung (vgl. Wardetzky 2007, 26). Janz-Peschke (2010) und Stock (1996) 
kommen zu dem Ergebnis, dass vermeintlich frei formulierte künstlerische Erzäh- 
lungen tatsächlich weniger frei und spontan sind als zunächst angenommen, da 
sich professionelle Erzähler*innen bestimmter mnemotechnischer Verfahren be- 
dienen, die ihnen dabei helfen, die Herausforderungen des freien Sprechens zu 
meistern. Dazu zählt beispielsweise die „unentwegte Aktivität des Registrierens 
und Wiederholens“ (Janz-Peschke 2010, 335), welche in einem umfangreichen 
Gedächtnis-Reservoir fest gespeicherter Eindrücke resultiert, die der Autor frei 
variierend miteinander verknüpfen kann (vgl. ebd., 336). Zudem existieren 
sprachliche Bausteine, die als formelhafte Versatzstücke im Gedächtnisspeicher 
abgelegt sind und als wiederkehrende Einheiten in die Erzählungen eingebaut 
werden (vgl. ebd. 338, vgl. Stock 1996, 81 £.). Zu diesen Bausteinen zählen u. a. 
phraseologische Wendungen, Redensarten, Zitate und Sprichwörter. Frei nacher- 
zählende Märchenerzähler*innen verzichten beispielsweise gewiss nicht auf die 
tradierten Formeln „Es war einmal“ oder „Und wenn sie nicht gestorben sind“. 


Insofern kann das künstlerische Erzählen aufgrund der angewandten Techniken 
nicht als rein produzierendes Sprechen angesehen werden. Gerade Nacherzählun- 
gen schriftlich fixierter Stoffe oder Wiedererzählungen weisen reproduzierende 
Züge sowohl auf inhaltlicher als auch auf sprachlicher Ebene auf. Dennoch bleibt 
das künstlerische Erzählen trotz aller Vorbereitung und mnemotechnischer Ver- 
fahren eine Form des freien Sprechens. Professionelle künstlerische Erzähler*in- 
nen sind nicht auf die exakte Wiedergabe einer Textvorlage angewiesen. Statt 
vorzulesen oder Auswendiggelerntes zu rezitieren setzen sie die memorierten 
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Bausteine frei improvisierend zusammen. Denn Improvisieren heißt nicht nur, et- 
was ohne umfangreiche Vorbereitung aus dem Stegreif zu tun, sondern auch, die 
im Vorfeld angeeigneten Kenntnisse um Strukturen, Inhalte und Formen mithilfe 
des gesamten mnemotechnischen und sprecherischen Repertoires in einem mög- 
lichst offenen Prozess abzurufen und variierend zusammensetzen zu können (vgl. 
Janz-Peschke 2010, 336). Darin besteht die Lebendigkeit und Freiheit des münd- 
lichen Erzählens, welche stark an Tolsons (2006) Forderung nach Ziveliness im 
Mediensprechen erinnert. Aufgrund der Gestaltungsfreiheit tritt zudem beim Er- 
zählen die Persönlichkeit der sprechenden Person viel deutlicher hervor, da sie 
selbst indirekt zum Autor bzw. zur Autorin des Hör-Textes wird und ihren indi- 
viduellen Fokus beim Erzählen legen kann. Auch Nacherzähler*innen sind keine 
reinen Reproduzent*innen, da sie sich ihre Vorlagen auf individuelle Art und 
Weise aneignen und selbst entscheiden, was sie wiedergeben und wie sie es spre- 
cherisch gestalten (vgl. Merz 2014, 18). 


4 Prosodie beim Vorlesen und beim freien Sprechen 


Die unterschiedlichen Entstehungsprozesse des Gesprochenen und damit verbun- 
den die ungleichen Ausmaße des Sprechplanungsaufwands beim Vorlesen und 
freien Sprechen haben auch unterschiedliche Ausprägungen der prosodischen 
Mittel zur Folge (vgl. Stock 1996, 22). Besonders betrifft dies die Merkmale der 
Akzentuierung, Gliederung und Rhythmisierung (vgl. ebd., 70). Stock schreibt 
dazu, dass sich aus den unterschiedlichen Sprechmechanismen der Psyche bei den 
beiden sprecherischen Formen Gliederungs- und Rhythmisierungsunterschiede 
ergeben, die ohne Schwierigkeiten zu erkennen sind (vgl. ebd.). Laut Meinhold 
(vgl. 2019, 15-18) besteht beim freien Sprechen ohne textliche Vorlage die Her- 
ausforderung darin, die zum Teil simultan ablaufenden internen Prozesse der ge- 
danklichen und innersprachlichen Planung sowie der artikulatorischen Realisa- 
tion zu koordinieren und zeitlich abzustimmen, ohne dass das strenge Zeitregime 
des Sprechens unterbrochen wird. Stock (1996, 81) bezeichnet dies als die 
„Gleichzeitigkeit von Konzeptentwicklung und artikulatorischer Ausführung“. 
Daher liegt es nahe, dass bei Störungen innerhalb des Planungsprozesses, bei- 
spielsweise wenn zu wenige oder zu viele Informationen für die sprecherische 
Realisierung vorliegen, in erster Linie die temporalen Abläufe des Sprechens be- 
troffen sind. Das äußert sich sprecherisch in der Ausprägung der temporalen pro- 
sodischen Merkmale (vgl. Meinhold 2019, 15). Dazu zählen sprachliche Fehler, 
artikulatorisch bedingte Versprecher und Verzögerungen (vgl. Stock 1996, 83). 
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Diese Phänomene werden als Defizite der sprecherischen Realisierung wahrge- 
nommen. Das Ziel des freien Sprechens ist daher in der Regel eine „Glätte des 
artikulatorischen Prozesses“ (Meinhold 2019, 26) bzw. eine möglichst hohe 
fluency of speech (vgl. ebd.). Allerdings kommt es hierbei auf den Kontext an, da 
insbesondere Verzögerungen in Form von Pausen auch bewusst sprechkünstle- 
risch oder rhetorisch als sogenannte Staupausen (vgl. ebd., 47) oder rhetorische 
Auflösungen (vgl. Neuber 2013, 135) zur Gestaltung eingesetzt werden können. 
Im Gegensatz zum freien Sprechen wird den Sprechenden beim Vorlesen die Ver- 
antwortung der Koordination der Sprechplanung durch das Vorhandensein einer 
ausformulierten Textvorlage abgenommen. Daher ist die Möglichkeit eines 
gleichmäßigen störungsfreien Zeitverlaufs des Sprechens von vornherein gegeben 
(vgl. Meinhold 2019, 26 £.). Daraus resultiert jedoch auch eine geringere Akzep- 
tanz gegenüber Fehlleistungen, da die Hauptfehlerquelle, die durch die internen 
Sprechplanungsabläufe bedingt wird, nicht vorhanden ist (vgl. ebd., 27). Die Her- 
ausforderung beim reproduzierenden Sprechen liegt eher in der adäquaten spre- 
cherischen Realisierung der Textvorlage. Meinhold (vgl. ebd.) fügt hinzu, dass 
eine dem Text gerechte, störungsfreie Lesung erst dann erreicht werden kann, 
wenn während des Vorlesens der Inhalt mitvollzogen wird, was beispielsweise 
durch die bewusste Erarbeitung einer Sprechfassung erzielt werden kann (vgl. 
Neuber 2004, 200). Die Ausprägung der prosodischen Merkmale wird daher beim 
Vorlesen weitestgehend von der inhaltlichen und sprachlichen Struktur der Text- 
vorlage und weniger von parallel laufenden Sprechplanungsprozessen mitbe- 
stimmt. 


Die unterschiedlichen zeitlichen Strukturformen beim Vorlesen und freien Spre- 
chen lassen sich u. a. am Auftreten von Pausen festmachen. Aufgrund des zusätz- 
lichen Zeitaufwands der inneren Planungsprozesse weist das freie Sprechen ten- 
denziell eine höhere Pausenhäufigkeit, einen geringeren Pausenabstand und 
dadurch insgesamt eine höhere Gesamtpausenzeit als das Vorlesen auf (vgl. Mein- 
hold 2019, 35). Dies hat zur Folge, dass beim freien Sprechen der Anteil der Pau- 
senzeit an der Gesamtsprechzeit zumeist höher ist als beim Vorlesen (vgl. ebd., 
36 f.; vgl. Goldman-Eisler 1968, 31; Geißner 1988, 158; Bose 1994, 138). Häufige 
und längere Pausen im Sprechfluss frei produzierenden Sprechens können daher 
auf stockende Sprechdenkprozesse hinweisen. Beim Vorlesen fallen hingegen 
die Planungsprozesse weg und die Bedeutungserschließung der vorzulesenden 
Inhalte ist vergleichsweise weniger aufwändig. Dadurch weisen vorgelesene 
sprecherische Realisationen tendenziell weniger Pausen, einen größeren Pausen- 
abstand und damit eine kürzere Pausenzeit insgesamt auf (vgl. Meinhold 2019, 
35). Als Folge sinkt der Anteil der Pausenzeit an der Gesamtsprechzeit (vgl. ebd., 
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36 £.). Allerdings wird die Häufigkeit und Dauer der Pausen beim Vorlesen maß- 
geblich durch die Art der Textvorlage und die Sprechhaltung mitbestimmt (vgl. 
ebd., 35). 

Neben den eben benannten Pauseneigenschaften führen die komplexen Sprech- 
planungsprozesse beim freien Sprechen außerdem dazu, dass „neben den syntak- 
tisch-inhaltlich begründeten Pausen zahlreiche weitere Unterbrechungen auftre- 
ten“ (Stock 1996, 85). Auch Bose (vgl. 1994, 59) und Goldman-Eisler (vgl. 1968, 
14) stellen fest, dass neben den von den Sprecher*innen bewusst zur Gliederung 
oder Aufmerksamkeitslenkung eingesetzten Pausen auch ungewollte Unterbre- 
chungen des Sprechflusses auftreten können. Diese entstehen häufig aufgrund von 
Planungsschwierigkeiten oder Unsicherheit. Beim Vorlesen ist die Gliederung 
durch Pausen in erster Linie durch die Textvorlage bzw. deren inhaltliche und 
sprachliche Struktur definiert (vgl. Stock 1996, 89). Daher stimmen die Gliede- 
rungssignale beim Vorlesen in der Regel mit den syntaktischen Texteinheiten 
überein (vgl. Bose 1994, 58). Winkler (vgl. 1973, 116 £.) begründet dies u. a. mit 
dem Vorhandensein von Satzzeichen in einem schriftlich vorliegenden Text, an 
denen sich die Sprecher*innen visuell orientieren können (vgl. ebd., 118). So 
kommt es laut Winkler dazu, dass die sog. Lesesprache einerseits die Spuren der 
Sprechplanung verwischt, ihre Gliederung andererseits aber den Sinnaufbau des 
Textes deutlicher herausarbeitet (vgl., ebd.). 


Ein weiteres prosodisches Merkmal der temporalen Struktur ist die Sprechge- 
schwindigkeit. Durch den größeren Zeitaufwand weisen frei gesprochene Äuße- 
rungen im Vergleich zu vorgelesenen tendenziell eine geringere Sprechgeschwin- 
digkeit auf (vgl. Winkler 1973, 115; vgl. Bose 1994, 137). Beim Vorlesen ist die 
Sprechgeschwindigkeit stark an die Art der Textvorlage und die Emotionalität der 
Sprechhaltung gebunden. Bose (vgl. 1994, 138) und Meinhold (vgl. 2019, 85) 
stellen zudem beim freien Sprechen eine höhere Geschwindigkeitsfluktuation von 
Sprechphase zu Sprechphase fest. 


Neben Erkenntnissen zu den temporalen Merkmalen beim Vorlesen und freien 
Sprechen verweisen einige Autor*innen zusätzlich auf die Sprechmelodie, hin- 
sichtlich derer sich das freie Sprechen und das Vorlesen voneinander unterschei- 
den. Bose (vgl. 1994, 138) und Winkler (vgl. 1973, 120) stellen fest, dass beim 
freien Sprechen seltener finaler Melodiefall auftritt, sondern dass die Sprechme- 
lodie am Ende von sprecherischen Einheiten häufig in der Schwebe bleibt oder 
steigt. Auch Stock (vgl. 1996, 115) verweist auf das häufige Auftreten von schwe- 
bender Endmelodie am Ende von rhythmischen Gruppen. Als Gründe dafür be- 
nennt er die Furcht vor dem Unterbrochenwerden durch andere Sprecher*innen 
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im Gespräch oder einen allgemeinen Mangel an sprecherischer Erfahrung (vgl. 
ebd.). Janz-Peschke (vgl. 2010, 343) geht von einer anderen Ursache aus: Sie führt 
dieses Phänomen auf die Anordnung der Inhalte beim freien Sprechen zurück, 
welche sich durch eine tendenziell gleichrangige Struktur auszeichnet und sich 
dadurch von der eher hierarchischen Struktur beim schriftlichen Sprachgebrauch 
unterscheidet (vgl. ebd.). Die assoziative Aneinanderreihung der Gedanken beim 
freien Sprechen ist demzufolge eine weitere mögliche Ursache für die schweben- 
den Endmelodien (vgl. ebd.). 


Die hier aus der sprechwissenschaftlich-phonetischen Fachliteratur entnommenen 
Erkenntnisse zeigen die unterschiedlichen Ausprägungen der prosodischen Merk- 
male des Vorlesens und freien Sprechens, welche in erster Linie in den unter- 
schiedlichen Sprechplanungsanforderungen begründet sind. Tendenziell er- 
scheint die prosodische Struktur beim freien Sprechen unregelmäßiger als beim 
Vorlesen. Dass dies jedoch nicht der Fall sein muss, wurde bereits im vorange- 
gangenen Abschnitt zu den professionellen künstlerischen Erzähler*innen ange- 
deutet, welche eine erstaunlich hohe fluency of speech erreichen. Auch dazu las- 
sen sich Erklärungsansätze in der Fachliteratur finden. Laut Goldman-Eisler 
haben der Grad der Vorbereitung und die Geübtheit der Sprecher*innen Auswir- 
kungen auf die Häufigkeit und Länge von Pausen beim freien Sprechen. Vorbe- 
reitete oder geübte Sprecher*innen weisen tendenziell weniger Unterbrechungen 
im Sprechfluss auf (vgl. Goldman-Eisler 1968, 17). Auch Winkler (1973, 111) 
vermutet, dass das freie Sprechen besser funktioniert, je intensiver die Spre- 
cher*innen sich mit dem Inhalt auseinandergesetzt haben, ohne ihn jedoch konk- 
ret auszuformulieren, und je sprach- und sprechgewandter die Sprecher*innen 
sind. Nach Meinhold (2019, 26) ermöglicht neben einer guten Organisation der 
zeitlichen Struktur der einzelnen Sprechplanungs- und Artikulationsschritte auch 
„ein gut organisiertes, d. h. mit minimaler Zugriffszeit zur Verfügung stehendes 
reiches sprachliches Formenrepertoire [...], das souveräne und zeitsparende An- 
wendung gestattet“, einen störungsfreien Sprechablauf. Papst-Weinschenk (vgl. 
2004, 65) sieht als Voraussetzung für das gelingende freie Sprechen einen um- 
fangreichen Wortschatz und die Kenntnis vielfältiger Satzmuster an. All diese Er- 
kenntnisse bestätigen die Tendenzen aus dem vorangegangen Kapitel und ver- 
deutlichen, dass beim freien Sprechen nicht zwingend Defizite hinsichtlich der 
prosodischen Struktur auftreten. 
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5 Der Erzähler Michael Köhlmeier 


Michael Köhlmeier ist einer der bekanntesten und erfolgreichsten österreichi- 
schen Schriftsteller. Sein Werk zeichnet sich durch eine große Anzahl von Veröf- 
fentlichungen sowie eine hohe Vielfalt aus. Seine literarische Bandbreite reicht 
von Romanen wie Abendland (2007), Die Abenteuer des Joel Spazierer (2013) 
und Zwei Herren am Strand (2014) sowie Novellen über Hörspiele bis hin zu 
Theaterstücken, Drehbüchern und Liedern (vgl. Austria Forum 2009). Neben di- 
versen weiteren Auszeichnungen erhielt er 2017 für sein literarisches Schaffen 
den Literaturpreis der Konrad-Adenauer-Stiftung (vgl. Braun 2017). Zusätzlich 
zu seiner literarischen Tätigkeit erlangte Köhlmeier große Bekanntheit durch 
seine frei gesprochenen Hörbücher, in denen er sich vor allem Nacherzählungen 
narrativ tradierter Stoffe wie Märchen und den Sagen der griechischen Antike 
widmet. Darüber hinaus erzählt er in weiteren Produktionen die Nibelungensage, 
die Bibel und einige Dramen von William Shakespeare nach (vgl. Merz 2014, 10). 
Köhlmeiers sprecherische Tätigkeiten werden dabei von der Öffentlichkeit nicht 
nur beachtet, sie erhalten auch große Anerkennung. In einem Artikel der Welt 
(Nüchtern 2014) wird der Autor als „Natural Born Narrator“ bezeichnet, als 
„Sprechsteller“. Die FAZ nennt Köhlmeier in einem Artikel (Kegel 2013) einen 
„virtuose[n] Geschichtenerfinder, ein[en] Erzähler wie aus vergangenen Zeiten“, 
und in der Jurybegründung zur Verleihung des Literaturpreises der Konrad-Ade- 
nauer-Stiftung heißt es: „Köhlmeier ist ein begnadeter Fabulator, der auch als 
Nacherzähler klassischer Mythen und biblischer Geschichten sowie im mündli- 
chen Erzählen überzeugt.“ (Gamradt 2017). Die große Anzahl seiner veröffent- 
lichten Nacherzählungen und die positiven Kritiken verweisen darauf, dass Köhl- 
meiers Nacherzählungen durch besondere Professionalität und ein hohes Können 
gekennzeichnet sind und sich einer großen Beliebtheit erfreuen. 


Michael Köhlmeier ist kein ausgebildeter Schauspieler oder Sprecher. Es lassen 
sich in der Literatur keine Hinweise darauf finden, dass der Autor das Erzählen in 
einer bestimmten Art und Weise gelernt hat (vgl. Merz, 2014, 23). Köhlmeier 
selbst bezeichnet sich als „erzählenden Schriftsteller“ (WDR-Mediathek 2019, 
00:22-00:24). Das Erzählen ist ein wichtiger Teil seines literarischen Schaffens 
(vgl. Merz 2014, 5). So widmet er sich nicht nur der mündlichen Nacherzählung 
tradierter Stoffe, sondern thematisiert das Erzählen auch in seinen schriftlichen 
Publikationen, indem er es als gestaltendes Element in seine Romane einflicht 
(vgl. Scheichl 2001). Zudem scheint das Erzählen schon immer ein wichtiger Teil 
im Leben des Autors gewesen zu sein. Die Lust am Erzählen ist ihm bereits in der 
frühesten Kindheit durch seine Familie vermittelt worden. Im Vorwort zu seiner 


© Frank & Timme Verlag für wissenschaftliche Literatur 291 


veröffentlichten Märchensammlung Märchen-Dekamerone bezeichnet Köhl- 
meier (2011, 10) seine Familie gar als „erzählsüchtig“, sodass es ihm, dem damals 
eher die Rolle des Zuhörers zukam, zeitweilig zu viel wurde, wenn Eltern und 
Schwester erzählten. Unter allen Familienmitgliedern sieht Köhlmeier seine 
Großmutter als die beste Erzählerin an (vgl. ebd.). Als Junge war er besonders 
von ihrer Art zu erzählen fasziniert. Sie verzichtete auf eine variationsreiche 
stimmliche und sprecherische Gestaltung, wurde nie laut und „hat auch nicht mit 
der Stimme gespielt.“ (ebd., 11). Stattdessen war ihre Sprechweise monoton „und 
sie wurde monotoner und leiser, je länger die Geschichte dauerte.“ (ebd.). Zudem 
setzte seine Großmutter Pausen, die z. T. unberechenbar waren und damit eine 
Spannung in der Erzählung auslösten (vgl. ebd., 12). Damit scheint sie nachhaltig 
den Erzählgeschmack Köhlmeiers geprägt zu haben, der auch heute noch ein stark 
variierendes und gestaltendes Erzählen als langweilig und übertrieben empfindet 
und selbst darauf verzichtet (vgl. WDR-Mediathek 2019, 02:04-02:06). 


Über seine eigene Entwicklung vom Zuhörer zum Erzähler schreibt Köhlmeier 
(1996b, 181-183): 


„Ich habe sehr bald die Erfahrung gemacht, dass es nicht genügt, sich diese Ge- 
schichten nur anzuhören. Man muss sie selbst erzählen. Man muss sie erzählend 
weiterspinnen. So und nur so eignet man sich diesen Schatz an. Erzählen heißt ja 
nicht nur etwas weitergeben, was man weiß [...]. Erst während [der Erzähler] die 
Geschichten ausbreitet, beginnt er sie zu begreifen, versteht er, dass sie aus unend- 
lich vielen Schichten aufgebaut sind, von denen nur eine bestimmt ist, von ihm 
freigelegt zu werden. Deshalb ist Erzählen, selbst das einfachste Nacherzählen, im- 
mer auch Erfinden. [...] Jeder, der eine Geschichte weitererzählt hat, hat sie im 
Erzählen zu seinem Eigentum gemacht, hat sie neu erfunden, hat der Geschichte 
seine eigene Seele geliehen.“ 


Köhlmeier sieht die selbstständige Aneignung eines Erzählstoffes als essenzielle 
Voraussetzung für das Erzählen an, um individuell und improvisierend damit um- 
gehen zu können. Es kann daher davon ausgegangen werden, dass auch Köhl- 
meier sich intensiv mit seinen Erzählstoffen im Vorfeld der Erzählungen ausei- 
nandersetzt. 
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6 Beispiel: Klassische Sagen des Altertums (Michael Köhlmeier 
1995) 


1995 erhielt der Autor aufgrund seiner langen Rundfunkerfahrung vom ORF den 
Auftrag, eine Serie mit Erzählungen der griechischen Sagen und Mythen zu ge- 
stalten. Die große Beliebtheit der Radioepisoden führte schließlich dazu, dass 
diese im Nachhinein der Ausstrahlung als Hörbuch produziert wurden (Klassische 
Sagen des Altertums, Teile I-III, 1995-1997, ORF Edition Radio Literatur). Die 
von Köhlmeier erzählten Radioepisoden wurden (sprachlich leicht geglättet) ver- 
schriftet und unter demselben Titel auch als gedrucktes Buch publiziert (Köhl- 
meier 1996b). 


Sagen und Mythen zählen zu den Stoffen der oralen Erzähltradition, die sich 
dadurch auszeichnen, „mündliche Erzählungen zu sein, deren Erzähltext fixiert 
wurde“ (Merz 2014, 34). So wurden die Geschichten der griechischen Antike 
lange Zeit mündlich überliefert und erst einige Jahrhunderte später durch Dichter 
wie Homer, Hesiod und Ovid aufgeschrieben (vgl. ebd., 66). Meist weisen daher 
die schriftlichen Versionen mündlich tradierter Stoffe durch die lange Zeit ihrer 
Überlieferung immer noch charakteristische Züge mündlicher Erzählungen auf, 
weshalb sich auch die literarischen Versionen der Stoffe noch heute für das Spre- 
chen eignen (vgl. Wardetzky 2007, 15). Berücksichtigt man, dass die bereits exis- 
tierenden Sagen der griechischen Antike die inhaltliche Basis der Erzählung bil- 
den, kann die sprecherische Produktionsweise bei den Klassischen Sagen des 
Altertums als künstlerische Nacherzählung konkretisiert werden. 


6.1  Köhlmeiers erzählerischer Umgang mit dem Original 


Köhlmeiers Vorgehensweise bei seinen Nacherzählungen kann als Antikenrezep- 
tion bezeichnet werden (vgl. Merz 2014, 69). Diese beinhaltet das Nach- und Neu- 
Erzählen von antiken Inhalten, wobei sowohl das Original im antiken Kontext als 
auch das daran angelehnte und daraus weiterentwickelte Endprodukt im Kontext 
der Rezipient*innen eine Rolle spielen. Köhlmeiers Auseinandersetzung mit den 
Originalstoffen ist daran zu erkennen, dass er in seinen Erzählungen z. T. direkt 
auf seine Quellen hinweist (vgl. ebd., 73). Allerdings erzählt Köhlmeier die My- 
then auf seine eigene Art nach und erfüllt dadurch die neuerzählende Charakte- 
ristik der Antikenrezeption. Im Gegensatz zu anderen Nacherzählern der griechi- 
schen Sagen, wie beispielsweise Gustav Schwab, gibt Köhlmeier die tradierten 
Stoffe nicht einfach wieder, sondern bearbeitet sie. Dadurch erhalten seine Nach- 
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erzählungen eine erzählerische Subjektivität (vgl. ebd., 62). Er verschafft den al- 
ten Mythen durch seine Erzählweise Aktualität (vgl. ebd., 70). Dies erreicht er z. 
B. dadurch, dass er als kritischer Erzähler fungiert, der sich unterschiedlicher 
Quellen bedient und „‚[die] Geschichten aus der Sicht des 20. und 21. Jahrhunderts 
neu erzählt, kommentiert und bewertet“ (Scheichl 2001, 106), ohne jedoch, bei 
aller Reflexion und Wertung, „eine strenge Mythendeutung vorzunehmen“ (Merz 
2014, 76). Zudem spricht er die Zuhörenden direkt an und stellt des Weiteren 
durch Parallelen zur Moderne einen Bezug zu seiner Zuhörerschaft her (vgl. ebd., 
81). Ebenso liefert er im Verlauf der Nacherzählungen „illustrative Erklärungen 
und Hintergrundinformationen zum besseren Verständnis“ (ebd., 76). Damit ver- 
schafft er den Zuhörenden neue moderne Perspektiven auf die alten Erzählstoffe 
und regt sie gleichzeitig zur Reflexion darüber an (vgl. ebd.). In all diesen Merk- 
malen manifestiert sich Köhlmeiers Funktion als freier Erzähler, welcher im Ge- 
gensatz zu einem vorlesenden Sprecher im Moment des Sprechens persönlich an 
der Kreierung des Gesprochenen beteiligt ist, wodurch der Hör-Text auch inhalt- 
lich eine Individualität erhält, die ein vorgelesener Text weniger aufweist. 


Die moderne Aufbereitung der antiken Stoffe in Köhlmeiers Nacherzählungen 
äußert sich auch in der Sprache des Autors, welche Merz (ebd., 77) als „locker, 
oftmals umgangssprachlich und expressiv“ bezeichnet und zu der Scheichl (2001, 
110) feststellt, dass sie „in keinem Element an den gehobenen, komplexen Satz- 
bau älterer Literatur erinner[t]“. In diesem Sinne entspricht Köhlmeiers Erzähl- 
weise nach Wardetzkys Definition nicht derjenigen professioneller Sprecher*in- 
nen, die alltagssprachliche oder umgangssprachliche Wendungen eher vermeiden 
(vgl. Wardetzky 2007, 48). Dementgegen sieht Scheichl (vgl. 2001, 103 £.) in der 
modernen Sprache und dem inhaltlichen Umgang Köhlmeiers mit den antiken Er- 
zählstoffen einen Hauptgrund für den Erfolg der Produktion. Auch Rothschild 
(2001, 220) resümiert in einem Artikel der Basler Zeitung zur Erzählweise Köhl- 
meiers in den Klassischen Sagen der Antike: 


„Was diese Radioaufnahmen, die in einer Box mit fünf CDs aufbewahrt wurden, 
jedoch zur Sensation macht, ist das Wie. Köhlmeier erzählt die Geschichten näm- 
lich, als kramte er sie gerade aus seiner Erinnerung, spontan, lebhaft, wie einen 
Bericht aus der eigenen Erfahrung. Er erzählt in einer heutigen, aber nicht in einer 
schnodderigen anbiederischen Sprache, mit allen Merkmalen der mündlichen Rede 
und völlig frei vom Schönklang professioneller Radiosprecher.“ 


Interessant ist, dass Rothschild (ebd.) in dieser Rezension neben den sprachlichen 
Merkmalen von Köhlmeiers Erzählweise auch auf die Merkmale der mündlichen 
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Rede verweist: „als kramte er [die Geschichten] gerade aus seiner Erinnerung“. 
Auch Scheichl (2001, 105) erwähnt in seinem Aufsatz die Mündlichkeit von 
Köhlmeiers Neu-Erzählungen, durch welche sie „eine in vergleichbaren Nach- 
schöpfungen nicht zu findende Lockerheit verleiht“ bekommen. Die hier sehr um- 
gangssprachlich und allgemein formulierten Hinweise deuten auf die sprecheri- 
schen Merkmale Köhlmeiers im Rahmen seines freien Nacherzählens hin. Den 
Zitaten ist zu entnehmen, dass es Köhlmeier gelingt, die Zuhörer*innen mit seiner 
lebendigen, spontan wirkenden Erzählweise zu fesseln, ohne dabei an Professio- 
nalität einzubüßen. Rothschilds (2001, 220) Zusatz, dass Köhlmeiers Erzählungen 
„völlig frei vom Schönklang professioneller Radiosprecher“ seien, erinnert zu- 
dem an Tolsons (2006) Forderung nach Liveliness beim Sprechen in den Medien. 
Im Unterschied zu Tolsons Konzept zeugt Köhlmeiers freie Nacherzählung aller- 
dings nicht von der künstlich hergestellten, performativen Spontanität einer re- 
produzierten Textvorlage, sondern von einer tatsächlichen Spontaneität. 


6.2 Ausgewählte prosodische Charakteristika 


In einer Pilotstudie wurden ausgewählte prosodische Charakteristika von Köhl- 
meiers Nacherzählung Klassische Sagen des Altertums I (1995, CD 1) untersucht 
und einer vergleichbaren Vorleseversion gegenübergestellt. Als Vergleich diente 
die vorgelesene Hörbuchproduktion Sagen des klassischen Altertums (2006) aus 
dem Audiolino-Verlag, welche auf dem verschrifteten Text der Radioepisoden im 
gleichnamigen Buch (Köhlmeier 1996b) basiert und von dem Schauspieler Hen- 
ning Venske gesprochen wurde. Im Folgenden wird ein kurzer erzählter vs. vor- 
gelesener Ausschnitt aus der Sage Orpheus und Eurydike hinsichtlich der Sprech- 
geschwindigkeit, Sprechgliederung, Akzentuierung und Endmelodisierung 
illustrativ vorgestellt. Die Auswahl dieser Merkmale beruht auf den im Kapitel 4 
zusammengetragenen Erkenntnissen aus der bisherigen Prosodieforschung zum 
Vorlesen und freien Sprechen in nichtmedialen, nichtkünstlerischen Kontexten. 
Eine ausführliche Darlegung des Designs und weiterer Resultate der zugrunde 
liegenden empirischen Pilotstudie ist nachzulesen in Nieper (2019, 58-82). 


In den Transkripten der beiden kurzen Ausschnitte (orientiert an GAT?2, Selting 
et al. 2009) ist jeweils die Artikulationsgeschwindigkeit in Silben pro Sekunde 
angegeben. Die Audios sind verfügbar über den QR-Code zu Beginn des Artikels 
bzw. unter: https://cloud.uni-halle.de/s/r5BGtMgb7PwyjVs. 
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Erzählte Version (Michael Köhlmeier) 


01 und DIEser arisTAios-| 5,18 S/s 
02 (0,9s) der erBLICKte- | 5,97 S/s 
03 (0,7s) euRYdike- | 5,33 S/s 
04 (0,4s) wie sie sich NIEderbeugte um die BLUmen- | 6,08 S/s 
05 (0,1s) zu PFLÜCKen-| 4,84 S/s 
06 (0,8s) und er WA:R-| 5,17 S/s 
07 (0,3s) AUgenblicklich von beGEHren erFÜLLT und-| 5,31 S/S 
08 (0,6s) GING zu ihr HIN ua; | 5,05 S/s 
09 (0,4s) euRYdike LIEF daVON arisTAios; | 5,07 S/s 
10 (0,4s) LIEF ihr HINterHER, | 4,72 S/s 
11 (0,9s) euRYdike- | 5,00 S/s 
12 (0,7s) hatte FURCHTbare ANGST vor diesem MANN, | 4,52 S/s 
13 (0,6s) der das NETZ über dem geSICHT hatte-| 5,46 S/s 
14 (1,2s) und sie BLICKte nicht auf den BOden und TRAT 5,99 S/s 
auf eine SCHLANge. | 


Transkript 1: Orpheus und Eurydike (Ausschnitt, erzählt von Michael Köhlmeier, Audio 1) 


Der erzählte Ausschnitt dauert insgesamt 27,8 Sekunden, er umfasst 14 Sprech- 
abschnitte mit insgesamt 104 Silben und 13 Sprechpausen. Die mittlere Artikula- 
tionsgeschwindigkeit beträgt 5,31 Silben pro Sekunde, die mittlere Verstehensge- 
schwindigkeit (bezogen auf Sprechsilben und Pausen) 3,74 Silben pro Sekunde. 
Der Anteil der Pausenzeit an der Gesamtzeit beträgt 29,5 %. 


Vorgelesene Version (Henning Venske) 


01 DIEser arisTAlos beOBachtete euRYdike; | 5,28 S/s 

02 (0,4s) wie sie sich NIEderbeugte um die BLUmen zu 5,74 S/s 
pflücken- | 

03 (1,1s) und er war AUgenblicklich von beGIERde 5,00 S/s 
erFÜLLT, | 

04 (0,4s) un:d RANNte auf sie zu.|| 4,11 S/s 

05 (1,1s) euRYdike: lief davon. || 5,07 S/s 

06 (0,5s) arisTAlos-| 5,06 S/s 

07 (0,2s) LIEF ihr hinterHER. || 5,81 S/s 

08 (0,85) euRYdike hatte FURCHTbare ANGST vor dem 6,63 S/s 

MANN, 

09 (0,55) der so ein: MERKwürdiges NETZ über dem 4,93 S/s 
geSICHT hatte, | 

10 (0,4s) U:ND sie BLICKte nicht auf den BOden und TRAT 5,44 S/s 
auf eine SCHLANge.| | 


Transkript 2: Orpheus und Eurydike (Ausschnitt, vorgelesen von Henning Venske, Audio 2) 


Der vorgelesene Ausschnitt dauert insgesamt 25,7 Sekunden, er umfasst 10 
Sprechabschnitte mit insgesamt 108 Silben und 10 Sprechpausen. Die mittlere 
Artikulationsgeschwindigkeit beträgt 5,35 Silben pro Sekunde, die mittlere Ver- 
stehensgeschwindigkeit 4.20 Silben pro Sekunde. Der Anteil der Pausenzeit an 
der Gesamtzeit beträgt 21,4%. 
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Bei fast gleicher Silbenzahl dauert die erzählte Version im Vergleich zur vorge- 
lesenen etwa 2 Sekunden länger. Sie besteht aus einem einzigen prosodisch abge- 
schlossenen Ausspruch mit deutlich fallendem finalem Melodieverlauf, allerdings 
vielfach in Sprechabschnitte untergliedert. Die einzelnen Abschnitte sind über- 
wiegend durch schwebende Endmelodie gekennzeichnet, seltener durch leicht fal- 
lende oder steigende Endmelodie. Das ist durchaus typisch für frei formulierendes 
Erzählen (vgl. Bose 1994, 138; Stock 1996, 115; Winkler 1973, 120). Mit der 
starken Sprechgliederung verbunden sind ein geringerer Silbenumfang der 
Sprechabschnitte und ein höherer Pausenzeitanteil, dadurch eine deutlich gerin- 
gere Verstehensgeschwindigkeit (3,74 versus 4,20 SIb/s). Ebenfalls auffällig sind 
die zahlreichen Sprechgliederungen, die an syntaktisch unerwarteten Stellen vor- 
kommen (sog. Binnenpausen, vgl. stellvertretend Bose 1994; Z. 02, 04, 06, 07 
und 09). Sie erwecken den Eindruck, als würde Michael Köhlmeier den Inhalt 
einerseits im Moment des Erzählens planen (Z. 04, 07, 09), andererseits könnten 
sie aber auch zur Spannungssteigerung eingesetzt sein (Z. 02). Michael Köhlmeier 
setzt in diesem Ausschnitt außerordentlich viele Akzente (51 Akzente auf 104 
Silben) und erreicht damit die Wirkung eines sehr eindringlichen Sprechens. 

Die vorgelesene Version enthält dagegen vier prosodisch abgeschlossene Aus- 
sprüche mit final stark fallender Melodie (Z. 04, 05, 07, 10) — durchaus typisch 
für Vorlesen (vgl. Winkler, 1973, 121). Der Vorleser setzt weniger Pausen (10 
versus 13), macht damit längere Sprechabschnitte. Es überwiegen Gliederungs- 
pausen zwischen semantisch-syntaktischen Einheiten. Nur einmal findet sich eine 
Binnenpause (Z. 06/07), möglicherweise zur Spannungssteigerung. Henning 
Venske setzt auf 108 Silben 27 Akzente, akzentuiert also im Mittel jede vierte 
Silbe. 


6.3 Zusammenfassung 


Die prosodischen Charakteristika der eben dargestellten kurzen Ausschnitte ste- 
hen exemplarisch für die Ergebnisse der gesamten Analyse (Nieper 2019). So 
weisen die dort untersuchten frei gesprochenen Hörbuchszenen im Vergleich zu 
ihren vorgelesenen Pendants insgesamt einen höheren Pausenzeitanteil, höhere 
mittlere Pausendauern und kürzere mittlere Pausenabstände auf; darüber hinaus 
einen höheren Binnenpausenanteil und Binnenpausenzeitanteil sowie durch- 
schnittlich längere Grenz- und Binnenpausendauern. Zudem zeichnen sich die frei 
gesprochenen Szenen durch niedrigere Artikulations- und Verstehensgeschwin- 
digkeiten sowie durch größere Anteile an schwebenden Endmelodien aus. Aller- 
dings stellen die Analyseergebnisse dieser Pilotstudie lediglich erste Tendenzen 
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dar, welche durch zusätzliche Untersuchungen erweitert und verifiziert werden 
müssten. 

Auch wenn einige prosodische Charakteristika in Köhlmeiers frei gesproche- 
nem Hörbuch, beispielsweise der höhere Pausenzeitanteil, die höhere bezogene 
Pausenhäufigkeit und der niedrigere Pausenabstand (im Vergleich zur vorgelese- 
nen Version) Ähnlichkeiten mit der Prosodie des freien Sprechens aufweisen 
(siehe Kapitel 5), kann daraus nicht automatisch auf einen höheren Sprechpla- 
nungsaufwand des Sprechers geschlossen werden. Denn wie bereits erwähnt, 
kann Köhlmeier aufgrund seiner Fähigkeiten und Erfahrung im freien Erzählen 
durchaus zu den professionellen künstlerischen Erzählern gerechnet werden, wel- 
che sich intensiv vorbereiten und mit ihren Inhalten ausführlich auseinanderset- 
zen. Daher ist es ebenso denkbar, dass Köhlmeier diese sprecherischen Merkmale, 
wie auch die häufigeren Binnenpausen und schwebenden Endmelodien, stilistisch 
bewusst einsetzt, um Spannung zu erzeugen und bei den Zuhörer*innen den Ein- 
druck zu erwecken, als ob sie am gedanklichen Entstehungsprozess der Inhalte 
beteiligt sind. So könnte Rothschilds (2001, 220) oben berichtete Wirkung, Köhl- 
meier krame seine Erzählungen im Moment des Sprechens aus seiner Erinnerung, 
durchaus in den ermittelten Ausprägungen der temporalen prosodischen Merk- 
male begründet liegen. Um detailliertere Ergebnisse zur Erzählweise Köhlmeiers 
zu erlangen und eindeutige Zusammenhänge zwischen Erzählweise und deren 
spontan und lebhaft wirkender Anmutung herstellen zu können, müssten weiter- 
führende Untersuchungen durchgeführt werden, die beispielweise auch über die 
rein prosodische Ebene hinausgehen. 
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Kindgerechte Informationsaufbereitung in Audioguides 


Lina Krüger, Leipzig 


In diesem Beitrag wird eine empirische Untersuchung zu kindgerechter Informa- 
tionsaufbereitung in Audioguides für Kinder vorgestellt. Zunächst werden Kenn- 
zeichen einer speziell auf die Bedürfnisse von Kindern zugeschnittenen Informa- 
tionsaufbereitung erläutert und in Beziehung zu Audioguides für Kinder gesetzt. 
Dann werden die Ergebnisse der Untersuchung von sieben Audioguides für Kinder 
aus deutschen Museen vorgestellt. Untersucht wurden Audioqualität und Makro- 
struktur, Erzählweise und Charaktere sowie die sprachliche und sprecherische Ge- 
staltung. 


1 Kindgerechte Medienangebote 


Kinder haben einen großen Wissensdurst und möchten verstehen, wie die Welt 
funktioniert (vgl. Schumacher / Schlinker 2009, 566). In welche Richtung diese 
Neugierde ausgeprägt ist, hängt von vielen Faktoren ab, unter anderem vom Alter 
des Kindes. Jüngere Kinder konzentrieren sich häufig auf ihre unmittelbare Le- 
bens- und Erfahrungswelt, wohingegen mit steigendem Alter das Bedürfnis 
nach Informationen über die Welt im Allgemeinen wächst (vgl. Gleich / Sch- 
mitt 2009, 593). Bei der Rezeption medialer Wissensformate bringen Kinder 
meist andere Interessen und kognitive Fähigkeiten sowie ein anderes Vorwissen 
ein als Erwachsene. Um Rezeptionsschwierigkeiten zu verhindern, ist es notwen- 
dig, Informationen speziell für Kinder aufzubereiten. Diese spezielle Informati- 
onsaufbereitung kann bereits durch empirische (Pilot)-Untersuchungen belegt 
werden: für Kindernachrichten (Leuchte 2015) sowie für Nachrichten, die sich an 
bestimmte Zielgruppen richten, z. B. an Deutschlernende (Schwenke et al. 2015) 
oder an Menschen mit geistigen Handicaps (Gerhardt / Schwenke in diesem 
Band). Die Anpassung an spezielle Hörergruppen betrifft nicht nur die thematische 
und sprachliche Gestaltung, sondern auch die sprecherische Umsetzung und die 
Ansprache. 
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In medienwissenschaftlicher und -pädagogischer sowie in museumspädagogi- 
scher und sprechwissenschaftlicher Literatur wird von bestimmten Grundprinzi- 
pien ausgegangen, die eine kindgerechte Informationsaufbereitung überhaupt erst 
ermöglichen: Schaffung eines positiven Lernumfelds, Vermittlung eines positiven 
Umgangs mit Scheitern, Ernstnehmen von Kindern (vgl. z. B. Holler 2013, 23; 
Schumacher / Schlinker 2009, 569). Zudem wird empfohlen, mediale Formate so 
aufzubereiten, dass sie von der Perspektive der Kinder ausgehen, an ihre Lebens- 
und Erfahrungswelt anknüpfen und ihre Denk- und Handlungsfähigkeiten be- 
rücksichtigen. Dazu gehört, dass Kinder bei ihrem Wissensstand abgeholt werden, 
dass auf ihre Interessen eingegangen wird und dass stets das Alter der Zielgruppe 
und der daraus resultierende kognitive Entwicklungsstand berücksichtigt werden. 
Darüber hinaus sollten Wissensformate für Kinder immer eine Kombination aus 
Wissensvermittlung (durch Erklärungen) und Unterhaltung (zur Förderung von 
Motivation und Spaß am Lernen) darstellen (vgl. z. B. Gleich / Schmitt 2009, 597; 
Götz / Schwarz 2013, 31 £.; Holler 2013, 23 £.). Hervorgehoben wird zudem, dass 
eine kindgerechte Informationsaufbereitung maßgeblich bereits durch die Wahl 
der Inhalte beeinflusst wird. So wird empfohlen, sowohl Themen zu behandeln, 
die Kinder im Alter der jeweiligen Zielgruppe interessieren könnten, als auch The- 
men, die bezogen auf das Format einer Sendung als notwendig erachtet werden. 
Dabei sollte stets ein Gleichgewicht aus informativen und unterhaltenden Inhalten 
geschaffen werden. Sofern Themen behandelt werden, die nicht dem kindlichen 
Erfahrungshorizont entsprechen, ist es notwendig, eine Verbindung zwischen dem 
behandelten Thema und der kindlichen Lebenswelt zu schaffen (vgl. z. B. Helmes 
1997, 316 f.; Mattusch 1998, 314; Serocka 2008, 58). Komplexe oder emotional 
belastende Themen sollten Kindern zwar nicht vorenthalten werden, bedürfen aber 
einer besonders sorgfältigen Aufbereitung (vgl. z. B. Krüger / Müller 2011, 395- 
406; Götz 2013, 19; Maier 2012, 28). Inhalte sollten umso verständlicher gestaltet 
werden, je komplexer sie sind. Dies gelingt beispielsweise durch den wohldosier- 
ten Einsatz von dialogischen Elementen, Bildkommentaren, Erklärungen, humor- 
vollen Elementen, aber auch durch Fokussieren und ggf. Weglassen von Informa- 
tionen und durch Vermeidung extremer Bilder. Zudem können sich effektvolle 
Mittel positiv auf den Lerneffekt der Kinder auswirken; auf auditiver Ebene kön- 
nen das zum Beispiel Toneffekte und Musik sein. 


Der Aufbau von kindgerechten Wissensformaten sollte sich durch Klarheit, Ein- 
fachheit und inhaltliche Kontinuität auszeichnen (vgl. z. B. Gleich / Schmitt 2009, 
597; Holler 2013, 25). Als besonders geeignet gilt das Story Telling, also die Wie- 
dergabe von Inhalten in Form einer Geschichte (vgl. z. B. Gleich / Schmitt 2009, 
597; Bhatty 1999, 4). Mit den in Story-Formaten eingesetzten Charakteren sollten 
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sich die Kinder identifizieren oder emotional verbunden fühlen können. Dies kann 
beispielsweise über Gemeinsamkeiten hinsichtlich der Altersstufe und des Wis- 
sensstands erreicht werden. Kinder mögen es, wenn die Charaktere einen positiven 
Umgang mit Scheitern zeigen und durch aktives Handeln und Ausprobieren Prob- 
lemlösungen selbst erarbeiten (vgl. z. B. Holler 2013, 23; Holler / Götz 2013, 41- 
44). Während Kinder in Wissensformaten selbst agieren können, um z. B. kindge- 
rechte Themen zu präsentieren (vgl. z. B. Holler / Götz 2013, 43), sollten Nach- 
richtenmagazine dagegen von jungen Erwachsenen moderiert werden. Diese soll- 
ten in ihrem Auftreten älteren Geschwistern ähneln, persönlich eingebunden sein 
und eine lockere, aber dennoch sefriöse Atmosphäre schaffen (vgl. z. B. 
Gleich / Schmitt 2009, 596 £.; Schumacher / Schlinker 2009, 568; Krüger / Mül- 
ler 2011, 408 £.). Die Sprache in Wissensformaten für Kinder sollte vor allem 
durch Einfachheit und Anschaulichkeit gekennzeichnet und tendenziell eher 
mündlichkeitsnah sein (vgl. z. B. Apel 2018, 357 f.; Gleich / Schmitt 2009, 597; 
Leuchte 2015, 84-88). Dies wird beispielsweise erreicht durch einfache syntakti- 
sche Strukturen, einfache, kurze Wörter sowie eher Verbal- als Nominalstil. 
Schwierige Wörter (z. B. Fachbegriffe) sollten entweder vermieden oder sofort er- 
klärt werden. 


Es existieren verschiedene mediale Angebote zur Wissensvermittlung speziell für 
Kinder. Dazu gehören zum Beispiel Kindernachrichten in Radio und Fernsehen 
(vgl. z. B. Leuchte 2015). Wie erste Untersuchungen zeigen (ebd.), ist das Spre- 
chen in Kindernachrichten gekennzeichnet durch eine höhere Sprechstimmlage, 
einen größeren Stimmumfang sowie eine bewegte Sprechmelodie, kombiniert mit 
einer klaren Strukturierung durch Pausen und Akzente. Dadurch vermitteln die 
Sprecher*innen eine freundliche und zugewandte Ansprechhaltung und erzeugen 
eine aufmerksamkeitsbindende Spannung (ebd.). Nach Leuchte (ebd., 95-98) ist 
allerdings ein übertriebener Gebrauch dieses child directed speech-Registers zu 
vermeiden, da sonst den Kindern das Gefühl vermittelt wird, nicht ernstgenommen 
zu werden. Zur Orientierung sollten sich die Sprechenden im Studio ein konkretes 
Kind im mittleren Zielgruppenalter des Formats als Adressaten vorstellen (vgl. 
ebd.). 


2 Audioguides für Kinder 


In Museen und Galerien haben Audioguides, also elektronische Ausstellungsfüh- 
rer, aufgrund der technologischen Entwicklung in den letzten Jahrzehnten zuneh- 
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mend an Bedeutung gewonnen (vgl. Hagedorn-Saupe 2016, 365). Sie werden ein- 
gesetzt, um die Gäste auf ihrem Rundgang zu begleiten und ihnen Informationen 
zur präsentierten Ausstellung zu liefern. Die Informationen beziehen sich immer 
auf ein Exponat, einen Ort oder andere visuell wahrnehmbare Gegebenheiten. Bei 
der Nutzung treten also stets akustische und visuelle Signale gleichzeitig auf (vgl. 
Eder 2009, 24). Eine Sonderform stellen spezielle Audioguides für Menschen mit 
Sehbehinderung dar, auf die an dieser Stelle jedoch nicht näher eingegangen wird 
(vgl. hierzu Föhl et al. 2007). Klassischerweise handelt es sich bei Audioguides 
um Kompaktgeräte, die vor Ort ausgeliehen werden. Durch die Eingabe von 
festgelegten Nummern wird ein Audio zu einem bestimmten Exponat abgespielt, 
das den Besucher*innen Informationen über das jeweilige Objekt präsentiert 
(vgl. Eder 2009, 11 f.; Bsp. Internetquelle 2). Mittlerweile existieren auch tech- 
nische Alternativen. So wird beispielsweise auf den Internetseiten einiger Mu- 
seen die Möglichkeit geboten, sich die entsprechenden Audiodateien oder eine 
passende App kostenlos auf Smartphones, I-Pods oder MP3-Player herunterzula- 
den (Bsp. Internetquelle 3). Mitunter sind auch an den jeweiligen Ausstellungs- 
stationen QR-Codes befestigt, welche mit dem Smartphone gescannt werden kön- 
nen, so dass anschließend die Audios erscheinen (Bsp. Internetquelle 4). 


Seit den 1970er-Jahren bieten viele Museen zunehmend speziell auf Kinder zuge- 
schnittene Programme an. Mittlerweile nehmen diese einen hohen Stellenwert ein 
und weisen ein breites Spektrum auf (vgl. Moyrer 2016, 249). So werden beispiels- 
weise spezielle Angebote für Kinder und Familientage veranstaltet, Dauer- und 
Wechselausstellungen um kindgerechte Vermittlungsebenen ergänzt und ganze 
Mitmach- und Familienausstellungen konzipiert. Darüber hinaus gibt es spezielle 
Führungen, Ferienaktionen und Workshops für Kinder (vgl. ebd., 250). Zu den 
musealen Vermittlungsangeboten für Kinder gehören auch Audioguides, die die 
jeweiligen Objekte „sprachlich altersgerecht aufbereiten“ (ebd, 252), und so ver- 
ständlich machen. Diese kindgerechten Audioguides können als ein Subgenre der 
Audioguides verstanden werden, welches primär darauf ausgelegt ist, Kinder zum 
Lernen anzuregen und für museale Ausstellungen zu interessieren. Sie ermögli- 
chen einem Kind, „sich den ‚Dingen‘ auf unkonventionelle Art zu nähern, und 
eröffnen ihm Spielräume, eigene Entdeckungen zu machen und Schlüsse zu zie- 
hen.“ (ebd.). Dabei werden meist Smartphones oder Tablets genutzt (vgl. ebd.), 
aber auch die konventionellen Audioguide-Geräte finden noch Verwendung (Bsp. 
Internetquelle 2). Die Festung Hohensalzburg beispielsweise begründet ihre Au- 
dioguides für Kinder mit der Notwendigkeit kindgerechter Informationsaufberei- 
tung, denn Kinder hätten eine ganz eigene Art, Dinge zu lernen und zu entdecken 
(vgl. Internetquelle 1). Die speziellen Audioguides für Kinder sind deshalb „ganz 
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auf die Bedürfnisse von Kindern zugeschnitten“ (ebd.). Das Lenbachhaus in Mün- 
chen will nach eigenen Angaben erreichen, dass sich die Kinder nicht wie ein „A- 
lien“ (Internetquelle 5) vorkommen, sondern sich im Museum wohl und richtig 
fühlen und dem Museumsbesuch mehr abgewinnen können. Deshalb hat es Audi- 
oguides erstellt, die nicht nur Fakten nennen, sondern anschauliche und lustige 
Geschichten erzählen, die mit Geräuschen und Klängen ausgeschmückt sind. Auf 
diese Weise sollen die Interessen der Kinder angesprochen werden und der Muse- 
umsbesuch noch mehr Spaß machen (vgl. ebd.). 


3 Empirische Untersuchung von Museums-Audioguides für 
Kinder 


In einer empirischen Pilotuntersuchung wurden sieben für Kinder konzipierte Au- 
dioguides deutscher Museen analysiert, um herauszufinden, ob und inwiefern die 
erhobenen Audioguides Gemeinsamkeiten bezüglich der kindgerechten Informa- 
tionsaufbereitung aufweisen. Entweder geht bereits aus der Bezeichnung oder Be- 
schreibung der Audioguides klar hervor, dass sie speziell für Kinder konzipiert 
wurden (Beispiel AG1), oder die Museen haben das auf Nachfrage bestätigt (Bei- 
spiel AG3). Alle untersuchten Audioguides standen zum Untersuchungszeitpunkt 
online zur Verfügung. Sofern ein Museum beziehungsweise ein Museumsverband 
mehrere Audioguides angeboten hat, wurde derjenige mit den meisten Hörstatio- 
nen aufgenommen (siehe Tabelle 1). 


Name und Ort Stationen | Einleitung | Erzählweise | Sprecher*innen | Sprecher*innen 
(Anzahl / Schluss insgesamt relevant für 
und Analyse 
Länge) 

AGI 30 ja/ja Story-Format | 1 Sprecher AGI SI: 

Meeresmuseum | 00:41— Taucher Jaques, 

Stralsund 04:06 fiktive Figur 

AG2 10 ja/nein Story-For- 11 Sprecher, AG2 SI: 

Lenbachhaus 02:51— mat, Erklä- 8 Sprecherinnen | Sprecherin (Kind) 

München 05:56 rungen (7 Kinder) AG2 S2: 

Sprecher (Kind), 
keine Rolle 

AG3 23 nein /nein | Frage-Ant- 3 Sprecherinnen | AG3 S1: 

Pinneberg Mu- | 00:14— wort (2 Kinder) Kind Sophie, 

seum 01:13 keine Rolle 

AG3 S2: 
Leo (Kind) 
AG3 S3: 
Sprecherin 


© Frank & Timme Verlag für wissenschaftliche Literatur 


305 


Name und Ort Stationen | Einleitung | Erzählweise | Sprecher*innen | Sprecher*innen 
(Anzahl / Schluss insgesamt relevant für 
und Analyse 
Länge) 

AG4 16 ja/ nein Story-Format | 1 Sprecher AG4SI: 

Gleimhaus Hal- | 00:31— (1 Kind) Kind Friedrich, 

berstadt 01:57 fiktive Figur 

AG5 18 ja/ja Story-For- 5 Sprecher, AGSS2: 

Pompejanum 00:58— mat, 3 Sprecherinnen | Erzähler (Kind) 

Aschaffenburg | 06:43 Zusatzinfos (8 Kinder) AGSS3: 

Valeria (Kind), 
fiktive Figur 
AGSS4: 
Quintus (Kind), 
fiktive Figur 

AG6 16 ja/ja Story-Format | 2 Sprecher AG6 S1: 

Römermuseum | 01:08— (1 Kind) Florianus (Kind), 

Kastell Boiotro | 02:19 fiktive Figur 

Passau 

AG7 10 ja/ja Frage-Ant- 1 Sprecher, AG7 S1: 

Museum für 01:03— wort 1 Sprecherin Sprecher Pi, fik- 

Mineralien und | 02:37 tive Figur 

Mathematik AG7 S2: 

Oberwolfach Sprecherin Phi, 

fiktive Figur 


Tabelle 1: Korpusübersicht 


Auf Basis der Literaturrecherche zu Kennzeichen kindgerechter Informationsauf- 
bereitung wurden folgende Untersuchungskriterien bestimmt: 


- Audioqualität 

- Makrostruktur (Anzahl und Länge der Hörstationen, Gestaltung von An- 
fang und Ende der Führung, Gestaltung der Hörstationen) 

- Erzählweise und Charaktere (Vorliegen eines Story-Formats, Konstruktion 
der Rahmenhandlung, agierende Figuren) 

- sprachliche Gestaltung (Satzbau, Verbal- vs. Nominalstil, Fachwörter) 

- sprecherische Gestaltung der Hauptcharaktere (Stimmhöhe und Tonhöhen- 
verlauf, Lautheit, Sprechgeschwindigkeit, Akzentuierung und Ansprech- 
haltung) 


Makrostruktur 

Die Audioguides für Kinder unterscheiden sich sowohl hinsichtlich der Anzahl 
als auch der Länge der Hörstationen deutlich. Ihre Anzahl variiert zwischen 10 
und 30, ihre Länge zwischen 00:07 und 06:43 Minuten (siehe Tabelle 1 am Ende 
des Beitrags). Als Ursachen für die Unterschiede werden individuelle Faktoren 
der Museen vermutet, wie Größe der Ausstellung, Komplexität der Exponate und 
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Budget. Die Untersuchung der Audioqualität (z. B. Homogenität des Klangbildes, 
Präzision der Audiobearbeitung, Störgeräusche) hat gezeigt, dass sich die Qualität 
der Audios deutlich unterscheidet und offensichtlich abhängig ist von den Gege- 
benheiten und Möglichkeiten der Museen. Auch die Qualität der sprecherischen 
Gestaltung durch die kindlichen und erwachsenen Sprecher*innen unterscheidet 
sich teilweise stark. Es scheint große Unterschiede hinsichtlich des sprecherischen 
Erfahrungsschatzes zu geben. Dieser Aspekt wurde in der vorliegenden Analyse 
jedoch nicht näher untersucht und bleibt weiterführenden Arbeiten vorbehalten. 


Bezüglich der Makrostruktur wurde außerdem untersucht, ob die Audioguides für 
Kinder Gemeinsamkeiten hinsichtlich Anfang und Ende der Hörstationen aufwei- 
sen. Dabei zeigte sich, dass Einleitungen durchaus typisch sind (bei sechs der sie- 
ben Audioguides), siehe Transkript 1: AG1 (orthografische Wiedergabe des 
Wortlautes). Die Audios zu den im Beitrag behandelten Beispielen (Transkripten) 
sind verfügbar über den QR-Code zu Beginn des Artikels bzw. unter: 
https://cloud.uni-halle.de/s/FH2Igel3X9fZ50Or. 


01 AGI1-S1: Oh Hallo, grüß dich. 


02 Sekunde, bin gleich soweit. 

03 Nur noch die Flossen und fertig. 

04 So. 

05 Na sag mal, wie siehst du denn aus? 

06 Da angelst du dir schon den mutigsten und schlaus- 


ten Taucher Jaques als Reiseführer und hast selber 
keinen Taucheranzug an und keinen Schnorchel dabei? 


07 Na wie soll ich denn jetzt mit dir abtauchen und 
durch die Meere schnorcheln? 

08 Nee ((lacht)) hab nur Spaß gemacht. 

09 Hier im Meeresmuseum können wir natürlich auch ohne 
Taucherausrüstung abtauchen. 

10 Aber bevor wir das tun, erkunden wir Neptuns Reich 
erst mal von Land aus. 

11 Ich verspreche dir - bei meiner Taucherehre -, das 


wird ein spannendes Abenteuer. 


Transkript 1: AG1, Hörstation 1, Audio 1 


Die Einleitungen sind überwiegend nach dem gleichen Muster gestaltet. Alle 
sechs beinhalten sowohl eine direkte Begrüßung des Zuhörers oder der Zuhörerin 
als auch eine Vorstellung der Hauptcharaktere, liefern Hintergrundinformationen 
zum Museum und geben einen Ausblick auf das, was die Hörer*innen während 
des Audioguide-Rundgangs erwartet (siehe stellvertretend Transkript 1). Die Ein- 
leitungen unterscheiden sich lediglich danach, ob sie eine eigenständige Hörsta- 
tion bilden oder Teil der Erklärung eines Exponates sind und ob die Funktions- 
weise des Audioguides explizit erklärt wird oder nicht. Im Gegensatz zur 


© Frank & Timme Verlag für wissenschaftliche Literatur 307 


Einleitung kommt eine explizite Schlusssequenz weniger häufig vor. Lediglich 
vier der sieben Audioguides werden gezielt beendet. Diese Schlüsse weisen nur 
eine Gemeinsamkeit auf, nämlich die direkte Verabschiedung des Zuhörers oder 
der Zuhörerin durch die Hauptfiguren (siehe Transkript 2: AG6). 


15 AG6-S1: Bei den Ausgrabungen im heutigen Garten entdeckte 
man die Grundmauern des Klosters und mauerte sie 
wieder auf. 


16 Draußen gibt es auch drei Guckies. 

17 Sie sind so eine Art Ferngläser mit Blick in die 
Vergangenheit. 

18 Einer steht unten im Garten und zwei oben auf der 
Terrasse des Museuns. 

19 Durch die Guckies siehst du, wie man sich das 
Kastell Boiotro an dieser Stelle vorstellen kann. 

20 Aber bevor du gleich rausgehst, denk bitte daran, 


dass du deinen Audioguide an der Kasse am Eingang 
wieder zurückgibst. 


21 Unser Rundgang ist jetzt nämlich zu Ende und ich 
muss wieder zurück nach Hause. 

22 Hm, wie das duftet. 

23 Meine Mutter hat sicher wieder etwas Leckeres 
gebacken. 

24 Also mach's gut und noch viel Spaß im Römermuseum. 


Transkript 2: AG6, Hörstation 15, Audio 2 


Erzählweise und Charaktere 

Die Erzählweise und der Einsatz der Charaktere innerhalb der Audioguides vari- 
ieren teilweise stark. Die Audioguides AG1, AG4 und AG6 sind komplett im 
Story-Format gestaltet. Sie ähneln einander in der Konstruktion der Geschichten 
und im Einsatz der Charaktere stark: Es findet sich überwiegend eine einfach kon- 
struierte Rahmenhandlung und es gibt jeweils nur eine tragende Hauptfigur. Allen 
drei Audioguides im Story-Format ist gemeinsam, dass die handelnden Hauptcha- 
raktere stets fiktiv sind und einen thematischen Bezug zum Museum haben, wie 
beispielsweise der „Taucher Jacques“ im AG1 des Meeresmuseums Stralsund 
(siehe Transkript 1 oben). Die Figuren werden sehr detailliert und individualisiert 
dargestellt und im Verlauf eines Audioguides immer weiter ausgebaut. Die kon- 
struierte Rahmenhandlung wird über den gesamten Audioguide hinweg aufrecht- 
erhalten, indem immer wieder durch thematische Bezüge daran angeknüpft wird. 
Unterschiede gibt es hinsichtlich der zeitlichen Erzählebene und dahingehend, ob 
das Museum als Teil der Geschichte eingebaut wird oder nicht. Rahmenhandlung 
und Hauptfigur werden bereits in der ersten Hörstation vorgestellt, wie aus dem 
Transkript 3 (AG4) hervorgeht: 
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01 AG4-S1: wo ist denn nur mein Federballschläger? 

02 Oh, Besuch. 

03 Guten Tag. 

04 Ich wollte gerade Federball spielen, aber würde 
dich auch gerne vorher durch das Haus führen. 

05 Mein Name ist Friedrich. 

06 Ich wohne nebenan, bin aber oft hier, denn Gleim 
lehrt mich lesen und schreiben. 

07 Er erzählt mir auch oft von seinen Freunden. 

08 Das sind interessante Leute, vor allem Dichter. 

09 Gleim kannst du hier von Angesicht kennenlernen. 

10 Er ist in diesem ersten Ausstellungsraum sogar 
zweimal zu sehen. 


Transkript 3: AG4, Hörstation 1, Audio 3 


Der AGS ist überwiegend im Story-Format gestaltet. Neben den Stationen, in de- 
nen die Geschichte erzählt wird, gibt es hier jedoch auch Stationen, in denen Zu- 
satzinformationen gegeben werden. Auch beim AG2 (siehe Transkript 4) stellt 
das Story Telling nur eine von zwei Erzählweisen dar, in denen Informationen 
und Erklärungen zu den Exponaten gegeben werden. Den eigentlichen Rahmen 
dieses Audioguides bilden die Erklärungen einer Gruppe von sieben Kindern. 


22 AG2-S6: Das riesige Teil, das von oben herab ragt, ist das 
erste von einigen Kunstwerken, die wir dir heute 
anhand von interessanten Geschichten vorstellen 
wollen. 

23 Mitgemacht haben 

24 AG2-S2: Aaron. 

25 AG2-S7: Jonathan. 

26 AG2-S8: Lilly. 

27 AG2-S9: Lorenz. 

28 AG2-S1: Medina. 

29 AG2-S10: Noah. 

30 AG2-S6: Und ich heiße Vaira. 


Transkript 4: AG2, Hörstation 1, Audio 4 


Die Geschichten im AG2 werden nur an ausgewählten Stellen eingesetzt, um be- 
stimmte Informationen rund um die Exponate sowie die Künstler oder Künstle- 
rinnen zu veranschaulichen. Sie werden stets von den Erläuterungen der Kinder 
eingerahmt, sind in sich abgeschlossen und thematisch voneinander unabhängig. 
Eine den gesamten Audioguide umfassende Rahmenhandlung mit gleichbleiben- 
den Hauptfiguren gibt es nicht. Die Kinder, welche als Hauptcharaktere dieses 
Audioguides bezeichnet werden können, sind keine fiktiven Figuren. Die Spre- 
cher*innen stellen sich in der ersten Hörstation namentlich vor (siehe Tran- 
skript 4). In den Geschichten werden die kindlichen Zuhörer nicht ins Geschehen 
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involviert, hingegen bei den Erklärungen durch die Sprecher-Kinder schon, da 
diese ihre Zuhörer*innen gelegentlich direkt ansprechen. 


Die Audioguides AG3 und AG7 weisen keine Story-Elemente auf. Stattdessen 
kann die Erzählweise als eine Art Frage-Antwort-Wechsel zwischen fragenden 
und erklärenden Instanzen bezeichnet werden. Im AG7 begrüßen die agierenden 
Hauptfiguren in der ersten Hörstation die Zuhörer*in, wie auch in den anderen 
Audioguides (siehe Transkript 5). Sie stellen sich namentlich vor und erklären den 
Zuhörer*innen kurz, was diese beim Anhören des Audioguides erwartet. Aller- 
dings erfährt man lediglich ihre Namen; detailliertere Informationen, die die Fi- 
guren persönlich charakterisieren würden, werden nicht gegeben. 


01 AG7-S1: Hallo und herzlich willkommen. 

02 Ich bin Pi, und ich zeige meiner Freundin Phi den 
Mathematikteil des MiMa. 

03 AG7-S2: Hallo, ich bin Phi. 


04 Sag mal Pi, warum heißt das MiMa eigentlich MiMa? 
05 AG7-S1: Also, das ist ganz einfach. 

06 Mi steht für Mineralien und Ma für die Mathematik. 
07 Zusammen heißt es MiMa. 


08 AG7-S2: Ah ok, das ist logisch. 
Transkript 5: AG7, Hörstation 1, Audio 5 


Bei sechs der sieben Audioguides werden die Zuhörenden in die Geschichten in- 
volviert oder zumindest begrüßt. Zudem wird klargemacht, wer spricht, warum 
diese Figur anwesend ist, wo man sich gemeinsam befindet, ob im realen Museum 
oder an einem fiktiv konstruierten Ort einer Geschichte, und was die Figuren und 
die Zuhörer*innen gemeinsam erwartet. Mitunter wird auch die Funktionsweise 
des Audioguides erklärt. Die Mehrheit der untersuchten Audioguides für Kinder 
legt Wert auf Transparenz, schafft eine persönliche Ebene zwischen Audioguide 
und Zuhörer*in, vermeidet Anonymität und geht über bloßes Informieren hinaus. 
Bei dem einen Audioguide, in dem die Figuren nicht vorgestellt werden, erfährt 
der oder die Zuhörende zumindest den Namen von zweien der drei Charaktere, so 
dass auch hier keine völlige Anonymität besteht. Auffällig ist, dass in fünf von 
sieben Audioguides Kinder tragende Sprechrollen haben, entweder als fiktive Fi- 
guren oder reale Personen. 


Sprachliche Gestaltung 

Alle untersuchten Audioguides für Kinder sind durch eine einfache und anschau- 
liche sprachliche Gestaltung gekennzeichnet. So finden sich z. B. überwiegend 
kurze einfache Sätze (siehe Transkript 6), lange komplexe Sätze mit mehreren 
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Komponenten kommen nicht vor. Dazu werden die Sätze auch kaum durch Ein- 
schübe und Nachstellungen verlängert (siehe Transkript 7), häufiger werden sie 
dagegen durch Auslassungen verkürzt (siehe Transkript 6, z. B. Zeile 07 und 12). 
Bei allen Audioguides überwiegt deutlich der Verbalstil (siehe Transkript 6, z. B. 
Zeile 13-17), der näher am alltäglichen mündlichen Sprachgebrauch ist als der 
eher für wissenschaftliche Fachtexte übliche Nominalstil. 


01 AG7-S2: Ist das hier das mathematische Forschungsinstitut? 
02 AG7-S1: Genau. 
03 AG7-S2: Und warum steht das Institut ausgerechnet hier im 


Schwarzwald? 

04 Hier ist doch nicht so viel los. 

05 AG7-S1: Genau deswegen steht es ja hier. 

06 Du weißt doch, was man braucht, um Mathematik zu 
machen. 


07 AG7-S2: Hm, Karopapier und einen Bleistift. 

08 AG7-S1: Richtig, aber das ist noch nicht alles. 

09 AG7-S2: Einen Radiergummi und einen Papierkorb. 

10 AG7-S1: Ja, das ist auch ganz wichtig, aber eine wichtige 
Zutat hast du noch vergessen. 

11 Was braucht man noch, wenn man über einer 
schwierigen Rechenaufgabe sitzt? 

12 AG7-S2: Einen Taschenrechner? 

13 AG7-S1: Nein, den brauchen Mathematiker nicht mehr. 


14 Sie rechnen eigentlich auch gar nicht. 

15 Sie überlegen sich höchstens, ob es möglich wäre, 
etwas auszurechnen. 

16 Und falls man es ausrechnen kann, überlegen sie, 
wie es geht. 

17 Aber das Rechnen selbst überlassen sie Schülerinnen 


und Schülern und Computern. 

18 AG7-S2: Dann weiß ich es nicht. 

19 AG7-S1: Man braucht ganz viel Zeit und Ruhe. 

20 AG7-S2: Ah, und darum steht das Institut hier in den 
Bergen, wo nichts die Ruhe stört, außer dem Wind 
und den Hirschen. 


Transkript 6: AG7, Hörstation 2, Audio 6 


01 AG5-S1: Die Culina, das heißt die Küche, war ein Arbeits- 
raum in der römischen Villa. 


Transkript 7: AG5, Hörstation 8, Audio 7 


Zur Einfachheit und Anschaulichkeit kindgerechter Sprache gehört auch, dass in 
den Audioguides Begriffe und Fachwörter, die für Kinder vermutlich schwer ver- 
ständlich oder unverständlich sind, vermieden oder umgehend erklärt werden sol- 
len. Da die Hörergruppe der Audioguides nicht homogen ist und demzufolge nicht 
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den gleichen Erfahrungshintergrund und Wissensstand hat, ist schwer zu bestim- 
men, ob ein Wort tatsächlich für alle Zuhörenden schwer verständlich ist. Die 
Analyse hat ergeben, dass in den sieben Audioguides des Korpus unterschiedlich 
mit Fachwörtern umgegangen wird: Es gibt nur einen Audioguide, in dem keine 
potenziell schwer verständlichen Worte aufgefallen sind. Es handelt sich dabei 
um den Audioguide, der mit Abstand die kürzesten Hörstationen hat. In drei Au- 
dioguides kommen recht wenige Wörter vor, die als für Kinder schwer verständ- 
lich eingestuft werden. In den anderen drei ist die Menge an Fachwörtern hinge- 
gen deutlich höher. Wenn Fachwörter vorkommen, wird unterschiedlich mit 
ihnen umgegangen: Manche werden erklärt, manche nicht, und manche werden 
ergänzend zu einem bekannten Begriff angeführt. Auch die Art und Weise, wie 
Begriffe erklärt werden, ist unterschiedlich. In den meisten Fällen werden die 
Fachwörter direkt im Anschluss erläutert (siehe Transkript 8), nur im AGS5 werden 
die Erklärungen in die Geschichte eingebaut (siehe Transkript 9), und im AG6 
finden sich auch einige indirekte Erläuterungen (siehe Transkript 10). Es gibt 
Fachwörter, die nicht erläutert werden, offensichtlich werden sie als bekannt vo- 
rausgesetzt oder es wird davon ausgegangen, dass sich ihr Sinn aus dem Kontext 
erschließt (siehe das Wort „Prototypen“ im Transkript 11, Zeile 14). 


12 AG7-S1: Die meisten dieser Flächen sind Minimalflächen. 
13 Minimal bedeutet so klein wie möglich. 
Transkript 8: AG7, Hörstation 3, Audio 8 

21 AG5-S3: Das ist der kürzeste Weg vom Atrium zur Küche, 
zur Culina. 

22 Da sind wir so gut wie nie. 

23 Kommt, lasst uns heute ausnahmsweise durch die 
Fauces gehen. 

24 Schau, wir laufen erst ein Stückchen nach rechts 
und jetzt gleich biegen wir in diesen schmalen Gang 
ein. 

25 AG5-SA: Du musst unserem Gast schon erklären, was das ist. 

26 AG5-S3: Hier in den Fauces halten sich meist nur unsere 
Sklaven auf. 

27 Daher nennen wir ihn auch den Sklavengang. 

28 wörtlich übersetzt bedeutet Fauces allerdings 
Schlund, Rachen oder enge Stelle. 

29 AG5-S4: Ich finde, das klingt irgendwie gruselig, oder? 

30 AG5-S3: Na, hat da jemand Angst? 


Transkript 9: AG5, Hörstation 6, Audio 9 
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12 AG6-S1: Wenn der Soldat seine Dienstzeit überlebte, und das 
war übrigens nur etwa die Hälfte der Männer, bekam 
er ein Diplom. 

13 Ein Stück einer solchen Urkunde kannst du in der 
Vitrine neben dem Touchscreen sehen. 


Transkript 10: AG6, Hörstation 10, Audio 10 


11 AG7-S2: Und die können alles drucken? 

12 wir müssen in der Schule alles mit Bleistift und 
Lineal zeichnen. 

13 AG7-S1: Diese mathematischen Drucke gibt es nur hier im Mu- 
seum. 

14 Eigentlich werden sie für das Herstellen von Proto- 
typen im Maschinenbau eingesetzt. 


Transkript 11: AG7, Hörstation 8, Audio 11 


Sprecherische Gestaltung 

Die Analyse der sprecherischen Gestaltung konzentrierte sich auf diejenigen 
Passagen, in denen aus einer Erzählperspektive agiert wird. Diese Passagen sind 
mitunter sachlich-informativ angelegt und werden dementsprechend ruhig bis 
leicht nachdrücklich gesprochen. So berichten die beiden sehr jungen Spre- 
cher*innen S1 und S2 im folgenden Ausschnitt (Transkript 12) über Gabriele 
Münter-und Wassily Kandinsky in Murnau. Ihr Sprechen ist übereinstimmend ge- 
kennzeichnet durch langsames bis mittelschnelles Sprechtempo, kleine Sprech- 
einheiten mit vielen starken Akzenten und zahlreichen kurzen Gliederungspau- 
sen, melodisch relativ wenig bewegt in geringem Tonhöhenumfang. 


31 AG2-S1: an DEM tag; | 


32 (.) zeichnete gabriele MüNter, | 

33 (.) noch MEHrere skizzen.| | 

34 (.) drei jahre SPäter, | 

35 neunzehnhundert ZWÖLF- | 

36 (.) entstand DIEses gemälde nach den ZEICHnungen. | | 


37 AG2-S2: in den NÄCHSten zwei JAHren malen münter und kandin- 
sky noch SEHR viel in murnau; | 


38 (.) bis neunzehnhundertVIERzehn- | 

39 der erste WELTkrieg ausbricht. || 

40 (-) alle RUSsen, | 

41 also auch kandinsky und seine FREUNde, | 

42 (.) müssen deutschland soFORT verLASsen.| | 

43 (.) denn DEUTSCHland, | 

44 zieht gegen RUSSland in den KRIEG. || 

45 (-) alle RUSsen werden deshalb als FEINDliche AUS- 


länder Angesehen. | | 
Transkript 12: AG2, Hörstation 4, Audio 12 
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In den meisten Audioguides agieren die Hauptcharaktere jedoch mit stärkerer per- 
sönlicher Beteiligung, die sich auch in einem abwechslungsreichen, emotionalen 
Sprechstil zeigt. Im folgenden Ausschnitt (Transkript 13) berichtet zunächst die 
junge Sprecherin S3 aus der Ich-Perspektive über einen Besuch in einer öffentli- 
chen Latrine im alten Pompeji und anschließend erklärt der fiktive Charakter 
Quintus (junger Sprecher S4) die Besonderheiten römischer Latrinen. Das Spre- 
chen beider ist gekennzeichnet durch wechselndes Sprechtempo und wechselnde 
Lautheit, unterschiedlich große Sprecheinheiten mit vielen starken, auch empha- 
tischen Akzenten, Pausen unterschiedlicher Länge, stark bewegte Sprechmelodie 
in großem Tonhöhenumfang. 


14 AG5-S3: ich war KÜRZlich unterWEGS; | 


15 °h und musste eine ÖFfentliche latrine aufsuchen; | | 

16 (-)°hh da hatte doch tatsÄcHlich; | 

17 °h IRgend so ein witzbold ein grafFIti in den putz 
geritzt; || 

18 (--) HIC (.) CAcavit BE:ne; | 

19 (-) HIER scheißt es sich GUT. || 

20 (--) GUT dass xanTHIpus diesen spruch nicht gelesen 
hat; || 

21 (-) ER versucht IMmer uns GUte umgangsformen beizu- 
bringen; | 

22 (-) und achtet !SEHR! darauf dass wir !KEI!ne 
schlimmen AUSdrücke verwenden. | | 

23 (-) er hätte sich über !SOLCH! einen ausspruch (.) 
SICHer AUFgeregt.| | 

24 AG5-S4: °h nun!JA:!; | 

25 (-) wenn man KEIne latrine zu hause hat? | 

26 dann FREUT man sich wahrSCHEINlich, | 

27 °h wenn die ÖFfentliche anlage (.) SAUber und 
£funk+ !TIONS!tüchtig ist; || 

28 °h ach !JA:!-| 

29 (-) zum thema(.)funk!TIONS!tüch:tig; | 

30 (-) unser beSUcher (.) vermisst in unserer laTRIne 
(.) eine VORrichtung; | 

31 °h die der Anschließenden SÄUberung dient; | | 

32 (.)°h soWEIT ich ihn <<:-)> verSTANden> habe, | 

33 (-) <<p>MURmelte er etwas von (.) 


toiLETtenpapier>, || 
Transkript 13: AG5, Hörstation 9, Audio 13 


4 Fazit 


Die exemplarische Analyse von sieben musealen Audioguides für Kinder hat so- 
wohl übereinstimmende Charakteristika als auch viele Unterschiede erbracht 
(z. B. hinsichtlich Audioqualität, Sprecherqualität). Typisch ist eine Einleitung, 
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in der stets der oder die Zuhörende direkt begrüßt wird, die Hauptcharaktere vor- 
gestellt, Hintergrundinformationen zum Museum geliefert und ein Ausblick auf 
den Audiorundgang gegeben werden. Ebenso typisch ist (in unterschiedlichem 
Ausmaß) das Story Telling, mit dem den kindlichen Zuhörern und Zuhörerinnen 
Inhalte vermittelt werden. Darüber hinaus werden Anonymität und bloßes Infor- 
mieren vermieden, stattdessen wird Wert auf Transparenz, Personalisierung und 
die Schaffung einer persönlichen Ebene zwischen Audioguide und Hörer*innen 
gelegt. Auch werden häufig Kinder in tragenden Rollen eingesetzt, die eine po- 
tenzielle Projektionsfläche zur Identifikation für die kindlichen Rezipienten bie- 
ten. Wenn fiktive Figuren vorkommen, so haben diese stets einen thematischen 
Bezug zum Museum. Zudem sind die Audioguides für Kinder durch eine einfache 
und anschauliche Sprache gekennzeichnet (einfacher Satzbau, Verbalstil, Erklä- 
rung von Fachwörtern). Charakteristisch für die sprecherische Gestaltung ist ein 
variabler, lebendig wirkender Sprechstil. Um aussagekräftigere bzw. generalisier- 
bare Ergebnisse zu erhalten, braucht es weiterführende Forschungen. 
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Stimmen im Hörspiel — Expertinnen und Experten berichten 


Maria Naumann, Halle 


Im Beitrag wird eine Pilotstudie vorgestellt, in der Experteninterviews mit Hör- 
spielverantwortlichen von Sendern der Arbeitsgemeinschaft der öffentlich-recht- 
lichen Rundfunkanstalten der Bundesrepublik Deutschland (ARD) durchgeführt 
worden sind (Naumann 2018). Die Expert*innen wurden um Auskunft darüber 
gebeten, wie die Suche nach Hörspiel-Sprecher*innen erfolgt, nach welchen Kri- 
terien diese engagiert werden und welche Anforderungen an Hörspielstimmen ge- 
stellt werden. Des Weiteren wurden die Expert*innen danach gefragt, welche 
Funktionen sie der Stimme im Hörspiel zuschreiben, ob es Idealstimmen gibt und 
wie sich Stimme und Sprechweise beschreiben lassen. 


1 Einleitung 


Das Hörspiel ist eine Kunstgattung, die sich ausschließlich auf das Auditive be- 
schränkt. Es fasziniert Hörer*innen sowie Hörspielproduzent*innen seit den An- 
fängen des Rundfunks zu Beginn des 20. Jahrhunderts. Die Möglichkeit, sich auf 
eine momentan dargestellte Wahrheit einzulassen und damit in eine andere Welt 
einzutauchen, kann beim Hörspiel besonders intensiv sein. Hörer*innen können 
das Gehörte durch ihre Vorstellungskraft ausschmücken, den Stimmen einen 
Raum zum Entfalten geben; sie werden damit zu Schöpfer*innen und Mitgestal- 
ter*innen, wobei die Grenze nur ihre eigene Fantasie ist. Innere Erlebniswelten 
tun sich auf, die sonst verschlossen bleiben. Dabei sind die Formen des Hörspiels 
zahlreich; von theatralisch-literarisch geprägten Ansätzen über offene Darstel- 
lungsarten hin zu Verbindungen mit der akustischen Kunst. Diese Entwicklung 
des Hörspiels geht mit einer Entwicklung der Stimme im Hörspiel einher. Durch 
die zahlreichen Realisierungsmöglichkeiten des Hörspiels verändern sich auch die 
Anforderungen an die Sprecher*innen. 


2 Anforderungen an Stimmen im Hörspiel: Literaturbericht 


Die Stimme im Hörspiel kann je nach Art des Hörspiels verschiedene Funktionen 
haben und muss damit verbundene Anforderungen erfüllen. Für Pinto (vgl. 2012, 
146) bildet die Stimme die Existenzgrundlage des Hörspiels, weil es ohne Stimme 
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kein narratives Hörspiel geben kann. Anders als auf der Bühne „existiert [man im 
Hörspiel] nur, soweit man eine Aufgabe hat, und wer wenige Aufgaben hat, exis- 
tiert wenig!“ (Arnheim 1936, 99). Im Vergleich zu Theater oder Fernsehen spielt 
die Stimme im Hörspiel nach Klippert (1977, 8) eine besondere Rolle: 


„Wort und Laut werden nur durch die Stimme vermittelt, sind also nicht im wörtli- 
chen Sinne literarisch, und der Stimme kommen Aufgaben zu, die weit über das 
hinausgehen, was die Stimme auf der Bühne und im Film zu leisten hat. Die Stimme 
kann Person, Ort der Handlung und diese selbst ‚verkörpern’, aber auch Instrument 


einer ‚text-sound-composition’ sein.“ (ebd.). 
„Sprich, damit ich dich und deine Welt sehe.“ (ebd., 105). 


Erst wenn die Stimme erklingt, wird der Hörspielraum erfahrbar. Die Stimme 
muss somit nicht nur sich selbst, sondern auch ihre Umgebung entwerfen, sozu- 
sagen Atmosphäre schaffen (vgl. Klippert 1977, 103-105; Everling 1988, 13; 
Pinto 2012, 189). Kreiert wird ein „Beziehungs-, Schaffungs- und Erlebnisraum“ 
(Klippert 1977, 105), wozu verschiedene stimmliche Faktoren beitragen: 


„Die biophysischen Gegebenheiten des Stimmapparates ebenso wie landschaftliche 
und nationale Gebundenheiten (Dialektfärbung und Sprachduktus), die Zugehörig- 
keit zu einer sozialen Schicht, Alter und Geschlecht und Schicksal; die psychische 
Struktur (die Dialektik und die Konflikte zwischen Bewußtem und Unbewußtem), 
Stimmung, Gefühle, Temperament, aber natürlich auch das, was zum personellen 
Oberbau gehört.“ (ebd., 99). 


Plensat (2008, 12) fordert vom Schauspieler „eine gut sitzende Stimme, Phonetik, 
Atemtechnik, gestisches Sprechvermögen, Erfahrung im Umgang mit dem Mik- 
rofon und dass er eingesungen, also warm gemacht zur Aufnahme erscheint“. 
Dazu kommt die „emotionale und intellektuelle Bewältigung der Rolle“ (ebd.), 
die er sprechen soll. Ziel des Sprechens im Hörspiel ist für Rüdenauer (o. J., o. S.) 
stimmliche Präsenz: 


„Wenn man die Augen schließt, dem Sprecher lauscht, der sich im Text verliert und 
diesem immer neue Deutungen gibt, entsteht eine unglaubliche Präsenz. Und das, 
obwohl der Schauspieler im Radio ja ein Beschnittener ist: Ihm fehlen Körper und 
Gesicht, Gestik und Mimik, Bewegung und Ausdruck. Alles legt er in die Stimme, 
Aufruhr und Traurigkeit, Freude und Angst. Jeder Schritt, jedes Stirnrunzeln, jedes 
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Augenrollen muss sich im Gestus seiner Stimme erahnen lassen, in der Schwingung 
und Bewegung eines Satzes, im Schweben eines Tons oder in den Pausen zwischen 
zwei Wörtern. Im Atmen und Luftanhalten, im Singsang oder der Einsilbigkeit sei- 


nes Erzählens.“ 


Der Auswahl von Stimmen (und Sprecher*innen) kommt eine entscheidende Be- 
deutung für eine Hörspielproduktion zu. Nach Plensat (2008, 12) entscheidet die 
„richtige Paarung der Spieler [...] in Stimme, Typus, Temperament, Alter [...] 
über die Stimmung im Studio, die Arbeitsfreude, das künstlerische Ergebnis“. 
Ihnken (1998, 18) fordert, dass Schauspieler*innen in Wortproduktionen des Hör- 
funks spontan klingen, so dass die Inszenierung des Hörstücks nicht mehr erkenn- 
bar ist. Dabei geht es ihm nicht um die Schönheit und Vollkommenheit der 
Stimme, sondern darum, dass die Sprecher*innen intuitiv und selbstverständlich 
Glaubwürdigkeit erzeugen, mit einer „Schwingung im Unterton, die Innerliches“ 
zeigt (ebd., 20; mit Verweis auf Schwitzke 1963, 81). Im Hörspiel werden Sprech- 
rollen oftmals mit Charakterstimmen besetzt, deren Klang — gemessen an einem 
physiologischen Stimmideal — auffällig ist, z. B. extrem tief, knarrend, heiser, fast 
aphonisch. Der Grund dafür liegt nach Eckstein (2008, 46) in dem großen Wie- 
dererkennungswert solch markanter Stimmen. Nach einer Studie von Sendlmeier 
(2005, 8) führt z.B. „ein steigender Tremorindex, [...] ähnlich wie steigende 
Shimmer-Werte, zu einer positiven Einschätzung“ von Hörer*innen. Das heißt, 
dass ein leichtes Stimmzittern (Tremor) und eine Abweichung der aufeinander- 
folgenden Amplituden der Stimmlippenschwingung (Shimmer) Kriterien für eine 
Charakterstimme sein können. 


Diese Anforderungen an Sprecher*innen und ihre Stimmen im Hörspiel setzen 
Professionalität voraus. Das legt nahe, vor allem Schauspieler*innen einzusetzen, 
da sie durch ihre Ausbildung sowohl über sprecherisch-stimmliche als auch über 
darstellerische Fähigkeiten verfügen, die angesichts knapper Produktions- und 
Aufnahmetage von Vorteil sind. Zur Sprecherauswahl, ob durch Castings, Daten- 
bank-Auswahl oder Theaterbesuche o. ä., findet sich nur ein Extrembeispiel von 
Kurt Reiss, einem Autor und Regisseur der 1940er bis 1960er Jahre. Dieser soll 
Sprecher*innen nur anhand ihrer Photographie, also nach ihrem Aussehen, aus- 
gewählt haben, da er von der Existenz eines „akustischen Gesichts“ ausging 
(Schwitzke 1963, 258 f.). 
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3 _ Expertenbefragung zur Stimme im Hörspiel 


Mit Hilfe einer empirischen Untersuchung wurde erhoben, welche Auffassungen 
Hörspiel-Expert*innen zu Stimme und Sprechweise haben und welche Bedeutung 
sie ihnen beimessen. Dazu wurden Hörspiel-Regisseur*innen und -Dramaturg*in- 
nen ebenso befragt wie Mitarbeiter*innen der Besetzungsbüros von Hörspielab- 
teilungen mehrerer öffentlich-rechtlicher Rundfunkanstalten. Darüber hinaus 
wurden die Interviewten gebeten, Hörspiel-Stimuli bezogen auf die Stimmlichkeit 
zu beschreiben und zu beurteilen. Die folgenden Fragen waren leitend für die em- 
pirische Untersuchung: 


1. Welche Kriterien sind für die Auswahl von Sprecher*innen im Hörspiel 
entscheidend? 

2. Wählen Autor*innen oder Regisseur*innen ihre Sprecher*innen vor allem 
nach stimmlichen und sprecherischen oder stärker nach anderen Eigen- 
schaften aus? 

3. Wie werden Stimme und Sprechweise beschrieben? 

4. Welche Anforderungen an die Stimmen von Sprecher*innen formulieren 
Hörspielverantwortliche? 


Die Ergebnisse der Untersuchung sollen einen näheren Einblick geben, auf wel- 
che Art und Weise mit Stimme und Sprechweise gearbeitet wird und inwieweit 
diese für die Produktionspraxis relevant erscheint (ausführlicher dazu vgl. 
Naumann 2018). 


3.1 Methode 


Für die Studie wurden Interviews mit sieben Expert*innen (Gläser / Laudel 2010) 
durchgeführt, in denen die Befragten möglichst unbeeinflusst ihre professionellen 
Erfahrungen und Meinungen äußern konnten. Diese qualitative Methode ist in der 
sprechwissenschaftlichen Radioforschung für ähnliche Untersuchungen wieder- 
holt eingesetzt worden, z. B. Gebauer zur Befragung von Stammhörer*innen von 
Radioprogrammen und Mücksch zur Befragung von Programmverantwortlichen 
im Radio (vgl. Bose 2015). Der Status als Expert*in ist vorrangig funktional zu 
verstehen: 
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„Experten interessieren nicht als Personen, sondern als Träger von Wissen, an dem 
der Sozialforscher interessiert ist. Experten stehen daher lediglich für Strukturzu- 
sammenhänge, sie verkörpern organisationale und institutionelle Entscheidungs- 
strukturen und Problemlösungen, sie repräsentieren Wissensbestände im Sinne von 
Erfahrungsregeln, die das Funktionieren von sozialen Systemen bestimmen — oder 
sie haben ‚nur’ Einblick in all diese Wissensbestände.“ (Liebold / Trinczek 2009, 
37). 


Für die Interviews wurde ein anpassungsfähiger Interviewleitfaden eingesetzt. 
Der Leitfaden gilt in qualitativen Experteninterviews als Instrument der Datener- 
hebung und zugleich als Übersetzung des Forschungsproblems in Interviewfra- 
gen, die in den „kulturellen Kontext“ (Gläser / Laudel 2010, 112) der Befragten 
eingebettet sind. Zur Strukturierung der Interviews mit den Hörspielverantwortli- 
chen wurde ein Leitfaden mit Haupt- und untergeordneten Detailfragen erarbeitet 
(vgl. Bortz / Döring 2003, 315). Darüber hinaus wurden Stimuli mit Ausschnitten 
aus Hörspielen angeboten, zu denen sich die Befragten äußern konnten. Der For- 
schungsprozess wurde bewusst offen gestaltet, so dass sich während des gesamten 
Erhebungsverfahrens Änderungen in den Fragestellungen ergeben konnten. Zur 
Audioaufzeichnung der Interviews wurde ein digitales Diktiergerät benutzt, dar- 
über hinaus diente ein Smartphone mit einer Diktiergerät-App zur Absicherung. 
Die Hörspiel-Stimuli wurden über das Smartphone vorgespielt. 


3.2  Befragte Personen 


Für die Auswahl der Expert*innen mit so genanntem „privilegierten Zugang“ zum 
Untersuchungsfeld (Meuser / Nagel 2009, 470) kamen vor allem Hörspielregis- 
seur*innen sowie Dramaturg*innen, Mitarbeiter*innen des Besetzungsbüros und 
Leiter*innen von Hörspielabteilungen in Frage. Zunächst wurden Personen mit 
diesen Funktionen angefragt, darüber hinaus auch Mitarbeiter*innen verschiede- 
ner Hörspielabteilungen öffentlich-rechtlicher Rundfunkanstalten in Deutsch- 
land. Für die Untersuchung konnten sieben Interviewpartner*innen gewonnen 
werden; in der Tabelle 1 sind sie mit ihrer Funktion und Tätigkeit aufgeführt. 


Inter- | Radio- Name Funktion / Tätigkeit im Berufs- Datum und 
view | sender feld Dauer 
1 MDR Matthias Leiter der Abteilung 02.03.2017 
Thalheim Künstlerisches Wort 64:42 min 
- seit 1992 
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Inter- | Radio- Name Funktion / Tätigkeit im Berufs- Datum und 


view | sender feld Dauer 
2 BR Katarina Chefdramaturgin in der Redaktion | 24.03.2017 
Agathos Hörspiel und Medienkunst 40:20 min 
— seit 2007 
3 BR Andrea Fenzl | Mitarbeiterin im Besetzungsbüro | 24.03.2017 
Hörspielabteilung 32:08 min 
— seit 2000 
4 SWR Iris Dröge- Hörspielregisseurin 27.03.2017 
kamp — seit 2001 51:36 min 
5 Rund- Klaus Zippel Hörspielregisseur beim Rundfunk | 04.04.2017 
funk der der DDR 53:30min 
DDR — seit 1965 
MDR Produktionsleiter der Abteilung 
Künstlerisches Wort im MDR 
— 1992-2001 


Produktionsleiter der Abteilung 
Künstlerisches Wort im MDR 


— 1992-2001 
6 WDR Martina Hörspieldramaturgin und Leiterin | 10.04.2017 
Müller-Wallraf | Abteilung Hörspiel 61:32 min 
- seit 1996 
7 WDR, Walter Adler Hörspielregisseur 10.04.2017 
SWR, — seit 1971 86:19 min 
BR, HR, 
DLF 


Tab. 1: Interviewte Expert*innen 


3.3 Hörspiel-Stimuli 


In den Interviews wurden kurze Hörspiel-Stimuli verwendet, um den Expert*in- 
nen Gelegenheit zu geben, über Kennzeichen und Auffälligkeiten der gehörten 
Stimme und Sprechweise zu sprechen. Jeder interviewten Person wurde ein Sti- 
mulus aus einer Produktion vorgespielt, an deren Produktionsprozess sie mitge- 
wirkt hatte. Es wurden möglichst aktuelle Hörspiele verwendet. Auf den Internet- 
seiten der meisten ARD-Rundfunkanstalten befinden sich Datenbanken mit 
aktuellen Hörspielproduktionen zum Nachhören. Als Stimulus diente jeweils ein 
Zusammenschnitt eines Sprechers bzw. einer Sprecherin aus einem Hörspiel, 
möglichst der Hauptdarsteller*in oder einer der größeren Sprechrollen. Bei der 
Auswahl der Stimulus-Sequenzen wurde darauf geachtet, dass sie die rollenbezo- 
gene sprecherisch-stimmliche Variabilität der Sprecher*in repräsentieren, so dass 
den Befragten genügend Impulse zur Beschreibung des Stimulus zur Verfügung 
standen. Die Tabelle 2 gibt Auskunft über die ausgewählten Hörspiele und die 
daraus verwendeten Stimuli. 
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Stimu- Hörspieltitel Regie Produk- | Befragte Person Spre- 
lus tion (Mitwirkung) cher*in 
1 Und jetzt: die Welt! | Stefan MDR Matthias Thal- Marina 
00:01:33 Kanis 2015 heim (Produkti- | Frenk 
onsleitung) 
2 Die Erfindung der |Leonhard |BR Katarina Agathos | Edmund 
00:01:48 | Roten Armee Frak- | Koppel- 2016 (Redaktion) Telgenkäm- 
tion durch einen mann per 
manisch-depressi- Andrea Fenzl 
ven Teenager im (Besetzung) 
Sommer 1969 
3 Gua Nim Washoe Iris SWR Iris Drögekamp | Manja 
00:00:37 Dröge- 2015 (Regie) Kuhl 
kamp 
4 Dorothy Leigh Klaus MDR Klaus Zippel Dagmar 
00:00:47 | Sayers: Der Pfir- Zippel 2003 (Regie) von 
sichdieb Thomas 
5 Sirius FM: Expedi- | Ulrich WDR / Petra 
00:00:36 | tion an den Bandtel- | Bassenge, | DLF / Martina Müller- | Konradi 
lerrand SWR Wallraf 
Philip 2017 (Redaktion) 
Stegers 
6 Jona Walter HR / SWR | Walter Adler Sandra 
00:00:59 Adler 2016 (Regie) Hüller 


Tab. 2: Übersicht der Hörspiel-Stimuli 


3.4 Durchführung der Interviews 


Alle Gespräche fanden im Zeitraum von Anfang bis Mitte April 2017 statt und 
dauerten im Durchschnitt 56 Minuten. Orte der Interviews waren Büros, Bespre- 
chungszimmer oder private Wohnräume der Interviewpartner*innen. Nach der 
Begrüßung und gegenseitigen Vorstellung wurden zunächst organisatorische Fra- 
gen geklärt sowie die Thematik und Vorgehensweise des Interviews vorgestellt. 
Danach wurden einige persönliche Daten abgefragt, um die gegebenenfalls re- 
cherchierten biographischen Informationen abzugleichen und die Inter- 
viewpartner*in kennenzulernen. Alle Befragten willigten ein, namentlich genannt 
und zitiert zu werden. Die eigentlichen Interviews umfassten drei Abschnitte, de- 
ren Leitfaden-Fragen in Tabelle 3 aufgeführt sind. 


Interview Kernfragen der Interviews 
Abschnitt 1 | Wie gehen Sie bzw. Ihr Sender vor, um Sprecher*innen zu finden? 
Was ist Ihnen bei der Auswahl eines Sprechers oder einer Sprecherin im 
Hörspiel wichtig? 
Welche Bedeutung hat Ihrer Meinung nach die Stimme im Hörspiel? 
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Interview Kernfragen der Interviews 
Abschnitt 2 | Warum wurde diese Stimme für diese Rolle ausgewählt? 

(Stimulus- | Wie kam die Besetzung zustande? 
präsentation) | Wie würden Sie die Stimme beschreiben? 
Was zeichnet eine gute Zusammenarbeit zwischen Regie und Sprecher*in 
aus? 
Welche Bedeutung hat für Sie ein hoher Wiedererkennungswert von Stim- 
men im Hörspiel? 
Abschnitt 3 | Sprecher wie Otto Sander oder Gert Westpfahl galten zu ihrer Zeit als Ide- 
alstimmen des literarischen Hörspiels. Wie ist das heute? Was wäre heute 
eine Idealstimme für Sie? 
Welche Wirkung sollen stimmliche und sprecherische Eigenschaften Ihrer 
Meinung nach entfalten? 


Tab. 3: Kernfragen der Interviews 


Im ersten Interview-Abschnitt wurde nach dem Hörspielbegriff der interviewten 
Person gefragt sowie nach ihrer Auffassung zur Bedeutung der Stimme im Hörspiel. 
Des Weiteren wurde danach gefragt, wie die Suche nach Sprecher*innen und deren 
Einstellung verläuft. Der zweite Interview-Abschnitt wurde mit dem Vorspielen des 
Stimulus eingeleitet, verbunden mit der Bitte, die gehörte Stimme und Sprechweise 
zu beschreiben. Gegebenenfalls wurden vertiefende Detailfragen gestellt. Im letzten 
Interview-Abschnitt wurde nach Idealvorstellungen von Hörspielstimmen gefragt 
und danach, ob es heutzutage ideale Stimmen gibt. Außerdem wurden Funktionen 
und Wirkungen von Stimmen diskutiert. Schließlich bekamen die Befragten die Ge- 
legenheit, noch weitere Themen anzusprechen. Den Abschluss der Interviews bil- 
dete der Dank an die befragten Expert*innen, außerdem wurden eventuelle Rück- 
fragen bearbeitet. Mitunter ergaben sich Gespräche vor dem Einschalten des 
Audiogeräts oder nach dem eigentlichen Interview. Sofern diese Gespräche für die 
Untersuchung relevante Informationen enthielten, wurden sie in einem Protokoll 
festgehalten. Notiert wurden außerdem Anmerkungen zur Gesprächssituation, zum 
Verhalten der Interviewerin, der interviewten Person sowie zu besonderen Vor- 
kommnissen (vgl. Lamnek / Krell 2016, 347; Hoffmann 2005, 275). 


4 Ergebnisse 


Die Audioaufzeichnungen der Interviews wurden transkribiert, strukturiert und 
ausgewertet. Die Antworten in den transkribierten Experteninterviews wurden ei- 
ner qualitativen Inhaltsanalyse unterzogen. Die Transkripte wurden dafür „schritt- 
weise mit theoriegeleitet am Material entwickelten Kategoriensystemen bearbei- 
tet“ (Mayring 2002, 114). Im Folgenden werden die Antworten der befragten 
Expert*innen tabellarisch anhand von Zitaten vorgestellt. 
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4.1 Beschreibungen von Stimme und Sprechweise 


Bei der Beschreibung von sprecherischen und stimmlichen Merkmalen im Hör- 
spiel trafen die Expert*innen größtenteils sehr detaillierte Aussagen. Die Be- 
schreibungsweise zeichnet sich durch eine sehr konkrete und metaphernreiche 
Wortwahl aus. Die meisten Aussagen trafen die Befragten zum Bereich „Spreche- 
rische und darstellerische Qualität“. Besonders wichtig scheinen ihnen die stimm- 
liche Wiedererkennbarkeit allgemein und innerhalb eines Hörspiels zu sein, aber 
auch die stimmliche Wandlungsfähigkeit, also die Fähigkeit, sprecherisch ver- 
schiedene Haltungen und Stimmungen zu erzeugen. 


Stimmbeschreibungen und Stimmbewertungen 
poliert und gut drapiert; Lieblingsstimmen; etwas sehr Besonderes; 
grandios; wohlklingend; fantastische Arbeit; phänomenal; perfekt; 
ungeheure Vitalität; weich; sexy; unbelastet; untypisch; ungeheuer 
versiert; klassisch; das Authentische; das Einmalige; changierend; 
klar; wiedererkennbar; bestimmte Prägnanz; wunderschöne Reibung; 
flexibel; schräg; Selten-Stimme, assoziationsreich; kehlig; rau; 
sehr viel Maskulines enthalten; 
Wahnsinnstimbre; voluminös; am Ohr gesprochen; 
kann man sich satt hören; beschissen; eine Zumutung; dämlich; nicht 
abgefuckt genug; beliebig; ganz kleines bisschen daneben; verschro- 
ben; austauschbar; im Ansatz gesichtslose Stimme; sinnbefreiter 
Singsang; glatt 


Sprechertypen und Rollen 

naive Passanten im Ton; Sympathieträgerin; eine gewisse Fremdheit; 
‚der Heisere‘ par excellence; einer, der einem Schlafenden am Ohr 
noch irgend-etwas zu übermitteln sucht; Performance-Stimme; Hoch- 
glanzsprecherinnen oder -sprecher; Charakterdarsteller; sehr souve- 
räne Person, die aber doch auch leicht abdreht; Bösewicht; Null- 
achtfünfzehn-Fernsehkommentarstimmen; eine Type; Standardstimme; 
Sprechmaschine; Suppenkasper; gottbegnadete Schauspielerin; Stim- 
menimitator 

Beschreibungen der sprecherischen und darstellerischen Qualität 
starke Präsenz; Stimme, die Leute wirklich verführt zuzuhören; ge- 
genwärtiges Organ, die sind so eindeutig 21.Jahrhundert; durchs Ohr 
ins Herz dringen; [..] diese Spielwut rauskitzelt; der muss mich am 
Schlafittchen kriegen; da muss irgendwas sein, was mich anreißt wie 
so eine Reibfläche beim Streichholzmäppchen; eine fremde Figur so 
durch sich hindurch gehen zu lassen, so zu ihr zu werden, dass es 
praktisch im Studio bei ihr nicht einen einzigen falschen Ton gibt; 
dieser Humanismus, der sich in seiner Stimme ausdrückte, die Liebe 
einfach zu den Figuren; ausgebildet; ungeheure Bandbreite; magisch; 
intelligente Stimmen; große Intimität; persönlichen Zugriff auf das 
Material haben; hoher Grad an Realismus; da geht auch jedes Satz- 
zeichen durch seinen Kopf; dass diese Sprache zur Musik wird; 
da ist immer irgendwie Berliner Straßenpflaster zu hören; overac- 
ten; laienhaft; künstlich; Nuschelei; das Hörspiel als Diamant [..] 
da kann ich nicht einfach Rohglas nehmen 


Tab 4: Beschreibungen von Stimme und Sprechweise 
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4.2 Funktionen der Stimme 


Alle Expert*innen verwiesen auf die Vermittlungsfunktion der Stimme und ihre 
diversen Einsatzmöglichkeiten. Die Funktionen der Stimme richten sich demnach 
nach der Art des Hörspiels — die Stimme könne sowohl eher kommunikative oder 
kompositorische Merkmale bedienen. Folglich könne man für eine Produktion 
nach ähnlichen Stimmen suchen, um beispielsweise einen Klangteppich aus Stim- 
men entstehen zu lassen; hier würden also Stimmen unter kompositorischen Ge- 
sichtspunkten ausgewählt. Bei anderen Produktionen dagegen verlange die Diffe- 
renzierung verschiedener Rollen für Hörer*innen extrem unterschiedliche 
Stimmen. Die Hauptfunktion von Hörspielstimmen ist demnach, eine gewünschte 
Wirkung zu erzeugen und zum Hinhören, zum Weiterhören zu verleiten. 


Expert*in Ausgewählte Zitate zu Funktionen der Stimme 

Matthias Das Syntaktische wäre, wer ist das Nebenan der Stimme, 

Thalheim also ist die Stimme alleine oder mit wem interagiert 
sie oder mit welcher Musik. [..] Aber ich finde diesen 


sozialen Charakter und diesen sozialen Gestus, den die 
Stimme eigentlich hat [die Semantik, MN], schon nach 
wie vor bezeichnend und wichtig. [..] 

Gut, die Momente, wo die Stimmen rein, abstrakt wie nur 
irgendwie möglich, eingehen, die gibt es sicherlich 
auch. Aber auch dort sucht man ja nach Unterscheidun- 
gen, in solchen Stimmcollagen. 


Katarina Also erstens braucht es per se keine Sprache und keine 

Agathos Stimme. Zweitens finde ich jetzt die menschliche Stimme 
aber auch etwas ganz Grandioses, Wunderbares und Faszi- 
nierendes. [..] Es braucht sie nicht, aber sie kann auch 


entscheidend sein. _[..] 

Hat die Funktion natürlich, erstmal Inhalt zu transpor- 
tieren 

oder aber auch ohne Inhalt über den Klang Wirkung zu 
erzeugen. Und diese Wirkung ist völlig subjektiv anders 


erfahrbar. 
Andrea Die Stimme ist das Allerwichtigste, denn nur die Stimme 
Fenzl transportiert, weil das Visuelle ja bei uns wegfällt. 


[oe] 
Es muss zur Produktion passen, weil da so viel Ver- 
schiedenes angefordert wird. 


Iris Ich würde sagen, dass zum Hörspiel auf jeden Fall Mu- 
Dröge- sik, Geräusch, Sprache gehören. Und alles kann alles 
kamp sein. Also, die Musik kann sprachlich werden, die Spra- 


che kann musikalisch werden, das Geräusch wird in bei- 
den Bereichen eingesetzt. 
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Expert“in Ausgewählte Zitate zu Funktionen der Stimme 


Klaus Ich kenne Kollegen und habe auch schon Hervorbringungen 
Zippel gehört, wo keine Stimme auftrat. [..] 

Also, für mich gehört zum Hörspiel UNBEDINGT die Stimme 
dazu. Und ist eigentlich auch immer Ausgangspunkt von 
allem, weil ich ja schon sagte, für mich ist der Text 
wichtig. [el 

Aber es ist wirklich das große Problem, ein Ensemble 
immer zusammenzukriegen, dessen Stimmen sich gut unter- 
scheiden lassen. 


Martina Ich persönlich bin ein sehr politischer Mensch und ein 
Müller- sehr inhaltsgetriebener Mensch. [..] Und deshalb denke ich 
Wallraf immer so vom Inhalt her und von der letzten Endes natür- 
lich von der Aussagekraft oder Aussagefähigkeit. Und des- 
halb formt für mich [..] der Inhalt und [..] das, was für 
mich da in diesem Echoraum steht, die Stimmauswahl. 
Walter Ich versuche Geschichten zu erzählen, die, ja, in klas- 
Adler sischer Weise einen Anfang, Mitte, ein Ende haben, wo- 


hin steuern, in denen, wie ich eben schon sagte, Men- 
schen sind und keine Sprechmaschinen. [...] 

Das ist manchmal sehr kompliziert, wenn Sie zehn Männer 
haben, zehn Hauptfiguren, muss es schon auch so sein, 
dass natürlich man als Hörer sofort den wiedererkennt. 


Tab. 5: Ausgewählte Aussagen zu Funktionen der Stimme 


4.3 Ausbildung der Sprecher*innen 


Nach Auskunft der Befragten sind die meisten Sprecher*innen ausgebildete 
Schauspieler*innen, wobei Theaterschauspieler*innen gefragter sind als Film- 
schauspieler*innen. Die Regie profitiere von der detaillierten Rollenarbeit im 
Theaterprobenprozess, was angesichts der knapp bemessenen Produktionszeit ei- 
nes Hörspiels nötig sei. Zur Aufnahme im Studio müssten die Sprecher*innen das 
Geforderte genau abliefern können, ohne lange Probenentwicklung. Die Ex- 
pert*innen machten aber auch darauf aufmerksam, dass gute Schauspieler*innen 
nicht selbstverständlich auch gute Hörspiel-Sprecher*innen sein müssen, da im 
Hörspiel der Körper der Schauspieler*in und dessen Darstellungsmöglichkeiten 
entfallen und alleiniges Ausdrucksmittel die Stimme ist. Die Mehrheit der Befrag- 
ten gab an, ebenfalls mit professionellen Sprecher*innen aus dem eigenen Rund- 
funksender zu arbeiten. Als Gründe führten sie zum einen Zeit- und Geldersparnis 
an, zum anderen seien insbesondere Rundfunksprecher*innen in der Lage, Texte 
so zu sprechen, dass Hörer*innen den Informationsgehalt bestmöglich aufnehmen 
können. Nicht ausgebildete Sprecher*innen würden insbesondere dann einge- 
setzt, wenn Kinder, Jugendliche oder Nichtmuttersprachler*innen benötigt wür- 
den. Laien würden aber insgesamt nur sehr selten eingesetzt; vor allem dann, 
wenn es auf authentisches, nicht gespieltes Sprechen ankomme. 
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Expert*in 


Ausgewählte Aussagen zur Ausbildung der Sprecher*innen 


Matthias 
Thalheim 


Ja, also indem [..] 80% der Sprecher schon professionelle 
Schauspieler sind. Aber ich glaube daran, dass der Beruf 
des Schauspielers und auch die Ausbildung letzten Endes 
auch ganz wichtig sind für das Hörspiel. Um das Hörspiel 
überhaupt auf so eine Konsistenz zu bringen, dass es eben 
Leute wirklich verführt zuzuhören. 


Katarina 
Agathos 


Es kommt immer so auf den Text drauf an. Und natürlich 
wird man einen hochliterarischen Text [..] von tollen 
Schauspielern, Schauspielerinnen lesen [lassen]. 

Aber es gibt sehr viele andere Hörspiele, wo das eben 
überhaupt nicht in Frage kommt, [..] wo wir Stimmen wol- 
len, die entweder aus einer ganz anderen Praxis kommen, 
wie zum Beispiel Nachrichtensprecher oder auch Performer, 
Sänger, Musiker, die mit ihrer eigenen Performance-Stimme 
ein ganz anderes Gestaltungsmittel zur Verfügung haben. 


Andrea 
Fenzl 


wir arbeiten eigentlich zu 98% nur mit Schauspielern. 
Auch wenn mal irgendwas so mehr in die Richtung sachli- 
cherer Text geht, das wird auch von denen dann gelesen. 
ls] 


Eine gute Ausbildung ist immer von Vorteil. 


Iris 
Drögekamp 


Ich habe zum Beispiel eines meiner ersten Hörspiele, da 
haben wir auch ein Casting gemacht. Ich brauchte rus- 
sischstämmige Dilettanten und es war fantastisch, wie die 
sich eben auch diesen Texten genähert haben. [..] 

Man muss sich auch trauen, mit denen zu arbeiten oder 
versuchen da irgendwas rauszubekommen. 


Klaus 
Zippel 


Ich entsinne mich an eine Produktion [..] - ich brauchte 
einen markanten, aber nicht zu dominanten Akzent - habe 
ich einen ungarischen Kollegen aus dem Rundfunk-Sinfonie- 
orchester beschäftigt. Und das ist erstaunlich gut gewor- 
den. Das musste ja auch nicht unbedingt so sein. 


Martina 
Müller- 
Wallraf 


Und es können aber auch Leute, [..] die ihre Stimmen nie 
irgendwie ausgebildet haben oder die keine Schauspieler 
sind, mich total erfassen und nicht mehr loslassen, weil 
sie auf eine so unbestechliche, unverbrüchliche, enge Art 
an ihrem Gegenstand dran sind und eine Möglichkeit fin- 
den, mich damit zu verbinden. 


Walter 
Adler 


Das Theater ist immer noch der Raum, wo sehr konzentriert 
und sehr qualitätsvoll gearbeitet wird über lange Zeit- 
räume. [..] Also muss ich im Grunde die Qualität, die er 
woanders sich erarbeitet hat, die ihm woanders [..] perma- 
nent abverlangt wird, die rufe ich nur ak. [..] Ich kann 
im Hörspiel aus einem guten Schauspieler einen sehr guten 
Schauspieler machen, aber aus einem, der große Probleme 
hat und Mühe hat [..] da ist nichts zu machen. Dafür hab 
ich schlichtweg die Zeit nicht mehr. 


Tab. 6: Ausgewählte Aussagen zur Ausbildung der Sprecher*innen 
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4.4 Kriterien für die Besetzung von Sprecher*innen 


Die Auswahlkriterien sind abhängig von der Art des Hörspiels und von der Regie, 
welche die endgültige Entscheidung im Besetzungsprozess trifft. Die Befragten 
nannten als ausschlaggebende besondere Momente von Stimmen z. B. Brüchig- 
keit, Individualität und Attraktivität. Innerhalb eines Hörspiels solle der charak- 
terliche Grundklang einer Stimme wiedererkennbar sein, jedoch solle die Stimme 
für verschiedene Hörspiele wandlungsfähig bleiben, so dass ein*e Sprecher*in 
nicht unbedingt an der Stimme wiedererkannt werde. Bekannte Sprecherinnen 
und Sprecher würden beispielsweise gewählt, um ein Hörspiel öffentlich wirksa- 
mer zu vermarkten. Dabei seien vor allem die Namen der Sprecher*innen von 
Bedeutung, nicht so sehr die Stimmen selbst. 


Die Mehrheit der Befragten sprach sich gegen merkantile Interessen aus und fo- 
kussierte stattdessen den künstlerischen Aspekt. Wichtig bei der Besetzung sei die 
darstellerische Qualität eines Sprechers, sie zeige sich durch das Einlassen auf die 
Textvorlage, innerliches Öffnen, Mitdenken, das Finden des persönlichen Zu- 
griffs und dessen Umsetzung. Besonderer Wert wird demnach auf das handwerk- 
liche Können der Sprecher*innen gelegt: Sie sollen sich mit dem Umgang mit 
verschiedenen Mikrofonen auskennen, sie sollen für verschiedene Textarten je- 
weils eine charakterliche Grundhaltung entwickeln können, mit einem hohen Maß 
an Glaubwürdigkeit, Flexibilität, Lebendigkeit und klaren Haltungswechseln, sie 
sollen nach dem Wunsch einiger Regisseur*innen eigene Ideen und Vorstellun- 
gen zum Text einbringen. 


Oftmals würden Sprecher*innen wiederbesetzt, deren Arbeitsweise die Regie be- 
reits kennt, um Zeit für die Suche nach neuen Sprecher*innen zu sparen. Durch 
die bekannte Arbeitsweise könne sich die Regie sicher sein, dass einer Sprecherin 
bzw. einem Sprecher das Geforderte abzuverlangen ist, und die Sprecher*innen 
könnten sich gegebenenfalls stärker einbringen. Jedoch berge dies auch die Ge- 
fahr der immer gleichen Auswahl an Stimmen, die sich schnell abnutzen. Wenn 
nur auf bekannte Stimmen gesetzt werde, stelle das eine Gefahr für die Hörspiel- 
kunst an sich dar. 


Expert*in Ausgewählte Aussagen zu Besetzungskriterien 


Matthias |Eine gewisse Porosität von Stimmen [.. ist] schon ganz gut, 
Thalheim |aber es wäre fürchterlich, ein Hörspiel zu haben, wo lauter 
solche porösen Stimmen zu hören wären. Man braucht die, um 
Kanten und Akzente zu setzen, aber man braucht natürlich 
darunter sehr gute, klare Stimmen und reine Stimmen. 
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Expert*in 


Ausgewählte Aussagen zu Besetzungskriterien 


Katarina 
Agathos 


Klar, es gibt bestimmte Literaturadaptionen von wirklich 
unglaublich tollen, literarischen Texten, die man gerne be- 
stimmten Schauspielern zutraut [..]. Das sollte einen aber 
auf gar keinen Fall, bitte nicht, dazu verleiten, da keine 
Experimente zu machen. Bloß nicht immer die gleichen Stim- 
men besetzen. [..] Ich finde, Stimmen nutzen sich wahnsinnig 
schnell ab, interessanterweise. 


Andrea 
Fenzl 


Das wird teilweise schon gemacht, aber das hat dann eigent- 
lich mehr mit dem Namen, ich glaube, nicht so viel mit der 
Stimme selber zu tun. Dass die Namen zwar ziehen, aber 
nicht, wenn der Hörer einschaltet, dass er sofort merkt, 
das ist der oder der. 


Iris 
Dröge- 
kamp 


Also, ich sehe es so, dass es zusammen entwickelt wird. Und 
ich hasse nichts mehr, wenn jemand nicht eine eigene Idee 
zu dem hat, was er liest. Das kann nicht sein. [..] 

Es ist so, dass man bei bestimmten Texten, die vielleicht 
etwas sperriger sind, dann gerne auf jemanden zurückgreift, 
mit dem man schon gearbeitet hat. Ich mache das auch sehr 
gerne. [...] 

Was gerne gemacht wird, ist, dass man immer auf alles Be- 
kannte setzt, weil sich das verkauft. 


Klaus 
Zippel 


Aber Stimmen, wo man gern hinhört, das ist, finde ich, für 

das Hörspiel schon wichtig. Denn es ist ja nichts zu sehen. 
Da möchte man ja doch wenigstens irgendwas haben, was einem 
davon überzeugt, dass man dieses Stück gerne weiter anhören 
möchte. [..] 

Aber, wie gesagt, eine gewisse stimmliche Attraktivität ist 
keineswegs ein Schaden bei Hörspielsprechern. 


Martina 
Müller- 
Wallraf 


Wiedererkennungswert, weiß ich noch nicht mal. Also, nicht 
in dem Sinne, dass man denkt: Ach, das ist doch die, die 
ich vorletzte Woche in dem Stück soundso schon gehört habe. 
Sondern Wiedererkennung im Sinne von Individualität. 


Walter 
Adler 


Viele Jahre lang habe ich mit Christian Brückner gearbei- 
tet. [..] Und irgendwann hab ich gesagt: Christian, das hat 
keinen Sinn mehr. Ich kann mit dir nicht mehr arbeiten, 
weil ich glaube dir einfach kein Wort mehr. [..] Du machst 
den Mund auf und dann sehe ich da Robert de Niro. [..] 

Je mehr Handwerk die [Schauspieler*innen] haben, umso ein- 
facher ist das für mich. 


Tab. 7: Ausgewählte Zitate zu Kriterien für die Besetzung von Sprecher*innen 


Für die Auswahl der Sprecher*innen ist die Regie der Produktion verantwortlich. 
Die Suche nach Hörspielsprecher*innen erfolgt nach Angaben der Befragten 
größtenteils durch regionale Theaterbesuche und aus der Erfahrung mit bestimm- 
ten Sprecherpersönlichkeiten heraus. Gegebenenfalls werden auch die Sprecher- 
datenbanken in den Besetzungsbüros der ARD-Rundfunksender konsultiert, die 
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in der Regel Stimmproben enthalten, allerdings offensichtlich keine Beschreibun- 
gen zu den Stimmen. Darüber hinaus wird auch auf die jeweilige Internetpräsenz 
von Sprecher*innen zurückgegriffen. 


4.5  Stimmliche Idealvorstellungen 


Die Hörspiel-Expert*innen wurden auch nach einer Idealstimme gefragt. Das Er- 
gebnis dazu ist durchaus mit den recherchierten Literaturaussagen vereinbar. 
Nach Auffassung der Befragten kann es keine Stimmideale geben, da die Fakto- 
ren, von denen dieses Ideal abhängig wäre, zu zahlreich und zu verschieden sind. 
Es gebe nur vorherrschende, dominierende Sprechstile in einzelnen Zeitabschnit- 
ten, die aber in Abhängigkeit zu Art und Text eines Hörspiels stünden. In den 
Interviews kristallisierten sich jedoch sprecherisch-stimmliche Eigenschaften her- 
aus, die für eine Eignung als wichtig bezeichnet wurden: Stimmliche und darstel- 
lerische Qualität, Wiedererkennbarkeit, aber auch Wandlungsfähigkeit einer 
Stimme, Hörerorientierung (siehe Abschnitt 4.2). Die Hörspielverantwortlichen 
gaben an, mitunter bereits beim Lesen der Manuskripte genaue Vorstellungen 
über geeignete Stimmen zu entwickeln. Im Verlaufe des Produktionsprozesses 
würden sie aber nicht zwingend an diesem Ideal festhalten, um den künstlerischen 
Entstehungsprozess nicht von vornherein einzuschränken, den auch die ausge- 
wählten Sprecher*in mitgestalten sollen. 


Expert*in Ausgewählte Aussagen zu Idealvorstellungen 

Katarina Ich möchte nur daraus, oder kann daraus kein Prinzip ab- 

Agathos leiten im Sinne von, das sind die idealen Stimmen oder 
das sind die fünf besten und nur mit denen machen wir 
es. [..] 
Hörspiel ist eine Kunstform und jede Kunst braucht Wei- 
terentwicklung und [..] darf kein geschlossener Klub wer- 
den. Das ist das Ende jeder Kunst. 

Iris Wenn ich eine Stimme immer häufiger höre oder eine Be- 

Dröge- setzung immer häufiger höre, hat es was damit zu tun, 

kamp wer sie einsetzt. Und es hat was mit Strukturen zu tun, 
mit Machtstrukturen, Hierarchien, und es hat was damit 
zu tun, wer am Kuchen knabbert und wer nicht. 

Klaus Wenn immer irgendwelche Leute, die aus irgendwelchen 

Zippel Gründen gerade mal ‚in‘ sind, dann immer wieder besetzt 


werden, weil sie gerade ‚in‘ sind [..] das ganze kommer- 
zielle Element so sehr dominiert, dann, finde ich, ist 
es schwierig zu sagen: Ja, es gibt den Sprecher. Nee, 
den gibt es eben nicht. 
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Expert*in Ausgewählte Aussagen zu Idealvorstellungen 


Martina Also, wir können wirklich alles zeigen, was im Augen- 
Müller- blick im Sinne von, unter der Überschrift Hörspiel ge- 
Wallraf macht, versucht, verworfen, produziert wird. Und da gibt 


es bei weitem eben nicht nur eine Ideal- oder Standard- 
stimme oder Tonlage oder Sprechweise oder Sprechhaltung. 
Walter Schöne Stimmen gibt es nicht. Die gibt es nur in der 
Adler Oper. [..] Aber im Hörspiel [..] gibt es nur Rollen, da 
gibt es nur Figuren, Menschen. [..] 

Ist das eine schöne Stimme [wohltönend], oder ist Sophie 
Rois eine schöne Stimme? Ich würde immer sagen, Sophie 
Rois ist eine schöne Stimme, weil das Schöne ist dann 
für mich das Authentische, das Einmalige, das Besondere, 
das Ungewöhnliche an dieser Stimme. 


Tab. 8: Ausgewählte Aussagen zu stimmlichen Idealvorstellungen 


5 Zusammenfassung und Fazit 


Durch die Befragung der sieben Expertinnen und Experten wurden Anforderun- 
gen an Stimme und Sprechen in aktuellen Hörspielproduktionen sowie Auswahl- 
kriterien für Sprecher*innen detailliert beleuchtet. Bezogen auf die aufgeführten 
Forschungsfragen (siehe Abschnitt 3) lässt sich folgendes Fazit ableiten: 

Die Auswahlkriterien sind abhängig von der Art des Hörspiels und von der Re- 
gie, welche die endgültige Entscheidung im Besetzungsprozess trifft. Um die ge- 
wünschte Wirkung zu erzielen, sind Stimmklang und darstellerische Qualität so- 
wie sprecherische Erfahrung entscheidend. Die Produktionsbedingungen von 
Hörspielen verlangen eine präzise und zügige Arbeitsweise, sodass die Wahl oft- 
mals auf Schauspieler*innen und auf prominente Sprecher*innen fällt, die als er- 
fahren gelten und deren Arbeitsweise bereits bekannt ist. 

Stimmliche und sprecherische Merkmale sind beim Auswahlprozess entschei- 
dend. Der Einsatz der Stimme ist abhängig von der Art des Hörspiels, ob sie z. B. 
stärker kommunikative oder kompositorische Aspekte bedienen soll. Folglich 
kann nach ähnlichen Stimmen gesucht werden oder auch nach extrem unter- 
schiedlichen, anhand derer die Hörer*innen die verschiedenen Rollen im Hörspiel 
differenzieren können. Die Hauptfunktion der Stimme im Hörspiel ist demnach, 
eine gewünschte Wirkung zu erzeugen und zum Hinhören bzw. Weiterhören ein- 
zuladen. Ein besonderes, individuelles Moment der Stimme (Brüchigkeit, Attrak- 
tivität) kann von Vorteil sein. Zur Verringerung von Kosten und Aufwand sowie 
zur besseren Vermarktung spielen sowohl die Erfahrung als auch die Bekanntheit 
einer Sprecherpersönlichkeit eine Rolle. Zu berücksichtigen ist auch der Organi- 
sationsaufwand: Um Termine einhalten zu können, müssen mitunter bis zu zwan- 
zig Anfragen gestellt werden, bis geeignete Sprecher*innen gefunden werden. 
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Beim Großteil der Sprecher*innen im Hörspiel handelt es sich um ausgebildete 
Schauspieler*innen. Als Grund dafür wird deren sofort abrufbare Fähigkeit zum 
glaubwürdigen Spielen genannt. Die Expert*innen fordern in der Zusammenar- 
beit mit Sprecher*innen außerdem Wandlungsfähigkeit, Präzision, professionel- 
len Umgang mit der eigenen Stimme und dem Mikrofon sowie eigene Gestal- 
tungsideen. Eine Idealstimme im Hörspiel gibt es nach Auffassung der befragten 
Expert*innen jedoch nicht, da die Faktoren, von denen dieses Ideal abhängig 
wäre, zu zahlreich und vielfältig sind. Die Ergebnisse der Befragung der Hörspiel- 
verantwortlichen weisen Parallelen zu den von Mücksch (2015) und Gebauer 
(2015) auf. Die befragten Programmverantwortlichen und Radiohörer*innen 
haben assoziationsreiche Eindrücke zum Gesamtbild der Moderationsperson for- 
muliert, die ihnen offenkundig wichtiger sind als eine professionelle stimmliche 
Qualifikation. In beiden Untersuchungen wurden als besonders wichtige Eigen- 
schaften einer Moderator*in Unterhaltsamkeit, Wiedererkennbarkeit und Authen- 
tizität genannt. Darstellerische Qualität, Wiedererkennbarkeit und sprecherische 
Erfahrung einer Sprecherin bzw. eines Sprechers sind auch den sieben Hörspiel- 
verantwortlichen in der hier vorgestellten Befragung besonders wichtig. 
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Sprechwirkung in Instagram-Stories und YouTube-Videos 


Alexandra Ebel / Lena Schotters, Halle (Saale) 


Digitale Medien sind aus dem Alltag der meisten Menschen nicht mehr wegzu- 
denken. Unter diesem Begriff werden sowohl die technischen Geräte, wie PC und 
Smartphone, als auch die verschiedenen Anwendungen, auf die mittels dieser Ge- 
räte zugegriffen werden kann, verstanden (vgl. Wedding 2020, 38). Ältere Medi- 
engruppen wie Printmedien oder elektronische Medien, zu denen auch Radio und 
Fernsehen gehören, sind von den digitalen Medien abzugrenzen, da sie nicht über 
deren spezifische Eigenschaften Multimedialität, Interaktivität und Hypertextua- 
lität verfügen (vgl. ebd. 39 f.). Während Analysen des Sprechens in elektroni- 
schen Medien besonders im Bereich der Radioästhetik zahlreiche Erkenntnisse 
gebracht haben (vgl. z. B. Bose / Föllmer 2015), die auch die Sprechpraxis im 
Rundfunk direkt beeinflussen, steht die Untersuchung von digital vermittelten 
Sprechereignissen, insbesondere im Kontext sozialer Medien, noch am Anfang. 

Im vorliegenden Beitrag sollen zwei empirische Analysen vorgestellt werden, 
die durch die Beschäftigung mit dem Sprechen in Social-Media-Formaten einen 
Beitrag zur Weiterentwicklung der Sprechwirkungsforschung hin zu digitalen 
Medien leisten. Im Mittelpunkt der Analysen steht die Wirkung von Sprechaus- 
drucksparametern und deren möglicher Einfluss auf die Zuschreibung von Au- 
thentizität sowie auf den Erfolg einzelner medialer Ereignisse. 


1  Sprechwirkung 


In jeder Kommunikationssituation werden unterschiedliche Wirkungen bei den 
Rezipient*innen ausgelöst, auch in medienvermittelter Kommunikation. Es kann 
generell zwischen direkten und indirekten Wirkungen unterschieden werden. Ers- 
tere zeigen sich unmittelbar in der Reaktion der Rezipient*innen, während letztere 
eine nur mittelbar wahrnehmbare Veränderung von Einstellungen, Meinungen 
oder Bewusstseinsinhalten bedeuten. Außerdem können lang- und kurzfristige 
Wirkungen unterschieden werden. 

Die Sprechwissenschaft erforscht seit den 1970er Jahren mit Hilfe empirischer 
Untersuchungen die Wirkung von Sprechereignissen. Der Sprechwirkungsfor- 
schung liegt die Annahme zugrunde, dass Kommunikationssituationen von ver- 
schiedenen äußeren und inneren Faktoren bestimmt werden (Hirschfeld et al. 
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2008, 778). Als Sprechwirkung ist „alles zusammen[zu]fassen, was in einer kon- 
kreten Kommunikationssituation bei der Aufnahme von Geäußertem in einem 
Rezipienten ausgelöst wird.“ (ebd., 774; Kursivierung i. O.). Die Wirkung beginnt 
zwar bereits während der Rezeption, kann aber auch längere Zeit danach noch 
weiter bestehen und sich verändern. Insbesondere im Hinblick auf massenmediale 
Kommunikationsereignisse ist zudem von Bedeutung, dass Kommunikation auch 
auf nachfolgende Kommunikationssituationen wirkt, indem Erwartungen gene- 
riert werden, auf deren Grundlage spätere Kommunikationen ausgewählt oder 
vermieden, vorbereitet und interpretiert werden (vgl. Hirschfeld et al. 2010, 56). 
Jede Kommunikation verändert zumindest die internalen Repräsentationen der 
Rezipient*innen, auch wenn dies teilweise unbewusst geschieht. In manchen Fäl- 
len zeigen sich die durch die Wirkung hervorgerufenen Veränderungen auch im 
Handeln der Rezipient*innen (Hirschfeld et al. 2008, 777 ff.). Um wenigstens ei- 
nen Teil der Veränderungen nachvollziehen zu können, die in den Rezipient*in- 
nen ablaufen, versuchen Sprechwirkungsuntersuchungen durch Befragungen, 
Prä-Post-Vergleiche oder Messungen die Wirkungen, die durch Sprechereignisse 
hervorgerufen werden, abzubilden. Im vorliegenden Beitrag werden zwei solcher 
empirischer Untersuchungen vorgestellt, die zum Ziel hatten, die Wirkung ver- 
schiedener, hauptsächlich prosodischer Parameter in Social-Media-Formaten zu 
erfassen. Zunächst sollen im folgenden Kapitel die dafür grundlegenden Begriffe 
„Authentizität“ und „Sprechausdruck“ dargelegt werden. 


1.1 Authentizität — Authentifizierung 


Ein bedeutender einflussnehmender Faktor im Rezeptionsprozess von Sprecher- 
eignissen ist die Sprecher*innen-Persönlichkeit. Diese manifestiert sich in großen 
Teilen in der Authentizität des*der Sprecher*in. Insbesondere im Hinblick auf 
medienvermittelte Kommunikation avanciert der Begriff des „Authentischen“ 
mehr und mehr zu einem diskutierten und umstrittenen Konzept. Prinzipiell lässt 
sich Authentizität, oft auch assoziiert mit Echtheit, Individualität, Unmittelbar- 
keit, Ursprünglichkeit, Aufrichtigkeit und Wahrhaftigkeit (vgl. Deppermann 
2000; Knaller / Müller 2006; Ulrich 2012), als ein „universaler Geltungsbegriff“ 
(Müller 2006, 56) einführen, der weder steigerungs- noch verhandlungsfähig ist 
und sich nicht auf eine konkrete Formel reduzieren lässt (vgl. ebd.). Die Authen- 
tizität eines Individuums zählt zu den zentralen menschlichen Stärken (vgl. Ker- 
nis / Goldman 2006, 235). Für die Wirkung von Moderationsstilen wurde bei- 
spielsweise herausgefunden, dass die wahrgenommene Authentizität eines*einer 
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Sprecher*in ein bedeutendes Merkmal dafür liefert, ob die Moderation positiv be- 
wertet wird (vgl. Böhme 2019; Gebauer 2015). 

Authentisches Handeln meint eine Harmonie von Kognitionen und Taten bzw. 
Äußerungen. Ein Individuum versucht sich demnach nach außen nicht in Inkon- 
gruenz mit seiner Identität darzustellen (vgl. Schallehn 2012, 68). Die Frage da- 
nach, ob zwischen Handlung bzw. Sprechereignis und Kognition in der konkreten 
Kommunikationssituation eine Kongruenz besteht, kann allerdings nur das Indi- 
viduum für sich selbst beantworten. Ein*e Sprecher*in hat jedoch keinen Einfluss 
darauf, ob sie*er auch tatsächlich auf andere authentisch wirkt. Die Zu- oder Ab- 
schreibung von Authentizität ist das Ergebnis der Wahrnehmung der Rezipi- 
ent*innen und wird als Authentifizierung betitelt (vgl. Jacke 2013, 78). Nach Till- 
manns (1996, 258) ist die Authentifizierung eines Individuums 


„immer eine Frage des Standpunktes, eine Frage, wie sehr man bereit ist, etwas als 
authentisch anzunehmen [...]. Es wird wahrscheinlich immer mehr ins allgemeine 
Bewußtsein vordringen, daß es sich hierbei nicht um eine fixe Größe handelt, son- 


dern um ein Konstrukt.“ 


Daraus ergibt sich, dass es in Sprechwirkungsuntersuchungen nicht möglich ist, 
Authentizität zu bestimmen, da diese ausschließlich introspektiv vom jeweiligen 
Individuum beurteilt werden kann. Aus der Außenperspektive lässt sich lediglich 
die Zuschreibung von Authentizität — also die Authentifizierung— beobachten und 
somit analysieren. 

Verschiedene Faktoren beeinflussen den Prozess der Authentifizierung. Die 
charakteristischen Bedingungen der Kommunikationssituation mit eingeschlos- 
sen (vgl. Hirschfeld et al. 2008, 780), spielen hier insbesondere Erfahrungswerte 
(Böhme 2019, 254 f.), eine Einstellungshomophilie zum*zur Sprecher*in (vgl. 
Böhme 2019; Sokolova / Kefi 2019) sowie soziodemographische Merkmale wie 
Alter und Geschlecht eine Rolle, welche vor allem im Hinblick auf mediale Kom- 
munikationsereignisse relevant sind (Sokolova / Kefi 2019, 13; Internetquelle 1). 
Darüber hinaus haben Sprechausdrucksparameter einen Einfluss darauf, als wie 
(in-Jauthentisch ein*e Sprecher*in wahrgenommen wird. 
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1.2 Sprechausdruck 


Einen erheblichen Beitrag zur Wirkung einer sprechenden Person leistet der 
Sprechausdruck. Denn zusammen mit dem Gesagten wird erst durch die Sprech- 
weise einer Person deren Intention verdeutlicht. Mit Bose (2001) kann Sprech- 
ausdruck definiert werden, als 


„An sprachliche Formulierungen gebundene beziehungsweise sie komplettierende 
sprecherische Ausdrucksformen, die zwar individuell ausgeführt, aber situations- 
und stimmungsadäquat konventionalisiert gestaltet sind“ (ebd., 265). 


Wichtig ist hierbei, dass der Sprechausdruck Konventionen unterliegt. D. h., auf- 
grund von Erfahrungen haben sich bestimmte Muster und gleichsam Erwartungs- 
haltungen im Hinblick auf die Nutzung einzelner Sprechausdrucksmerkmale her- 
ausgebildet. Die jeweilige Ausführung erfolgt dann individuell innerhalb der 
konkreten Situation. Während ihrer Sozialisation beobachten und probieren Her- 
anwachsende verschiedene Sprechausdrucksweisen und festigen somit ihr Reper- 
toire an situativ und kulturell angemessenen Mustern des Sprechausdrucks (vgl. 
Bose 2001, 266; Bose et al. 2013, 68). Sprecher*innen verändern, zumeist unbe- 
wusst, ihre Sprechweise in Abhängigkeit von ihrer Stimmungslage sowie ihrer 
Einschätzung der Situation. Dieser angepasste Sprechausdruck wird als pathog- 
nomisch bezeichnet. Daneben steht, sozusagen als Basis, der physiognomische 
Sprechausdruck, der sich aus angeborenen oder habituellen Gestaltungsweisen 
ergibt (vgl. Stock 1987, 57 f.; Bose et al. 2013, 68). 

Die sprecherischen Ausdrucksformen äußern sich vor allem durch den Einsatz 
prosodischer Parameter, zu denen folgende auditiv wahrnehmbare Elemente zäh- 
len (vgl. Neuber 2002, 51 f.; Hirschfeld / Stock 2016, 39): 


- Sprechmelodie 

- Lautheit und Lautheitsdifferenz 

- Sprechgeschwindigkeit und deren Variationen 
- Sprechrhythmus (Pausen und Akzentuierung) 
- Sprechspannung 

- Stimmqualität 

- Stimmausdruck 

- Dauer der einzelnen Merkmale 
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Doch auch artikulatorische Merkmale sind Teil des Sprechausdrucks (vgl. Pie- 
tschmann 2011, 72; Travkina 2010, 89 f.). Denn auch artikulatorische Spannungs- 
verhältnisse, Klangfärbungen und Assimilationen, die sich in konkreten Lautrea- 
lisationen zeigen, werden emotional überformt und situativ angepasst. 

Zur Erfassung und Beschreibung der verschiedenen Sprechausdrucksmerkmale 
und um deren mögliches Zusammenspiel beobachten zu können, hat Bose (2001, 
301 f.) einen Katalog entworfen. Darin werden auf einer zumeist fünfstufigen bi- 
polaren Skala folgende Merkmale erfasst: 


- Sprechtonhöhe und deren Modifikation 

- Lautheit und deren Modifikation 

- Stimmklang und dessen Modifikation 

- Sprechtempo und dessen Modifikation 

- artikulatorische Parameter 

- Komplexphänomene wie Rhythmus, Akzentuierung und Sprechspannung 


Analysen des Sprechausdrucks liefern Erklärungsansätze dafür, wodurch be- 
stimmte Wirkungen innerhalb eines Kommunikationsereignisses zustande ge- 
kommen sind, so auch in massenmedialen Kommunikationen. Beispielsweise las- 
sen sich Wirkungen, die aus einigen Kommentaren zu YouTube-Videos 
entnommen werden können, auf den Einsatz bestimmter Sprechausdruckspara- 
meter zurückführen (vgl. Ebel (eingereicht)). 

Untersuchungsergebnisse der Radioforschung u. a. von Böhme (2019) und Ge- 
bauer (2015) weisen darauf hin, dass Hörer*innen Moderationen, die abgelesen 
und somit vorgeplant und geschult wirken, häufig als unnatürlich und somit als 
inauthentisch beschreiben. Dabei können Phänomene wie der Sprechrhythmus 
beeinflussen, ob eine Moderation als abgelesen oder frei gesprochen wahrgenom- 
men wird. Ein gleichmäßiger, fließender Sprechrhythmus gilt dabei oft als Anzei- 
chen für reproduzierendes, vorgeplantes Sprechen. Affektiertheit und Pseudo- 
Witzigkeit der Moderator*innen gelten als weitere Indizien für Inauthentizität. 
Ebenso unnatürlich und gekünstelt empfinden die Hörer*innen eine hohe Artiku- 
lationspräzision sowie einen resonanzreichen Stimmklang — Merkmale, die auf 
eine mögliche sprecherische Ausbildung des*der Sprecher*in hindeuten und dem 
Wandel des Stimmideals zur scheinbar unausgebildeten „Stimme von nebenan“ 
(Bose / Finke 2016, 90) gegenüberstehen. Die Hörer*innen bevorzugen stattdes- 
sen Sprechstile, die locker, ungezwungen und spontan wirken. Tolson (2010, 286) 
spricht von einem „fresh talk“, der durch direkte Ansprache der Zuhörer*innen 
und durch den Amateurcharakter einen „authenticity effect“ hervorrufe. Und laut 
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Gebauer (2015, 18 f.) sind besonders Versprecher ein häufig genanntes Kriterium 
für den transportierten Amateurcharakter einer Moderation und damit für Authen- 
tizitätseffekte. In ihrer prosodischen Gestaltung seien diese „amateurhaften“ 
Sprechstile kontrastreicher und weniger gleichmäßig, wiesen häufige Tempo- und 
Lautheitswechsel, größere Unterschiede zwischen Haupt- und Nebenakzenten, 
Dynamik, Melodie, Tempo, Sprechspannung und Artikulationspräzision auf. 
Auch ein rauer, gepresster bis brüchiger Stimmklang zähle zu den scheinbar als 
positiv und authentisch wahrgenommenen prosodischen Merkmalen (vgl. Böhme 
2019, 257 ff.; Gebauer 2015, 18 £.). 

Das Rezeptionsverhalten in sozialen Medien unterscheidet sich grundlegend 
von dem in elektronischen audiovisuellen Medienformaten, weshalb davon aus- 
zugehen ist, dass die zitierten Befunde aus Untersuchungen zur Radioästhetik 
nicht ungeprüft auf Plattformen wie YouTube oder Instagram übertragen werden 
können. Bevor zwei Sprechwirkungsuntersuchungen, die sich auf verbale Kom- 
munikation auf diesen Social-Media-Kanälen beziehen, skizziert werden, sollen 
zunächst die Besonderheiten sozialer Medien dargelegt werden. 


2 Kommunikation in sozialen Medien 


Die Kommunikationslandschaft hat sich in den letzten zwanzig Jahren massiv 
verändert. Besonders das Universalmedium Internet etablierte sich gesellschaft- 
lich und entwickelte sich in rasanter Geschwindigkeit. In diesem Zusammenhang 
prägen vor allem soziale Medien die individuelle Kommunikation sowie übergrei- 
fende Strukturen der Mediengesellschaft. Unter dem Begriff „Social Media“ wer- 
den Medien und Technologien gefasst, die „soziale Interaktion und Kollabora- 
tion” ermöglichen (Specht / Theobald 2010, 21). Da es allen angemeldeten 
Nutzer*innen möglich ist, eigene Inhalte hochzuladen und somit anderen zugäng- 
lich zu machen, wird die klassische massenmediale Trennung zwischen Produ- 
zent*innen und Rezipient*innen aufgehoben (vgl. Gabriel / Röhrs 2017, 15). Der 
Gebrauch von Social Media hat stark zugenommen: Im Januar 2021 konsumierten 
mit weltweit 4,2 Milliarden Personen, etwa 54 % der Weltbevölkerung, Social- 
Media-Anwendungen (vgl. Internetquelle 2). Dies entspricht einer Zunahme von 
1,9 Milliarden Social-Media-Nutzer*innen seit 2016. 

Die Geschichte von Social Media ist von einer hohen Dynamik, laufenden Neu- 
erungen und Veränderungen geprägt (vgl. Decker 2019, 46). Trotz vieler Unter- 
schiede in Verbreitung und Funktionsweise ist eine wesentliche Gemeinsamkeit 
der vielfältigen Social-Media-Anwendungen, dass soziale Medien es den Men- 
schen ermöglichen, „Informationen aller Art mithilfe digital vernetzter Medien 
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anderen zugänglich zu machen“ (Taddicken / Schmidt 2017, 4). Sie verändern so- 
mit die Strukturen gesellschaftlicher Öffentlichkeit, indem die Massenkommuni- 
kation in ihrer institutionalisierten Form nun neuen Modi, Arenen und Kontexten 
anderer Art weicht. Diese Kommunikationsinhalte sind für einen großen Perso- 
nenkreis sichtbar und zugänglich. Die gemeinsame Zielsetzung von Social Media 
ist der kommunikative Austausch und die soziale Interaktion (vgl. ebd., 4 f.). 

Die mittlerweile große Gruppe der Social-Media-Anwendungen lässt sich in 
verschiedene Spezialformen klassifizieren. Auf zwei dieser Formen — soziale 
Netzwerke und Content Communities — und deren jeweils populäre Vertreterin- 
nen — Instagram und YouTube - soll im Folgenden näher eingegangen werden, 
da aus ihnen die Korpora für die vorzustellenden Sprechwirkungsuntersuchungen 
generiert wurden. 


2.1 Instagram, Instagram-Stories und der Faktor „Authentizität“ 


Aufgrund ihrer Reichweite und ihres Wachstums gehören die sogenannten sozia- 
len Netzwerke zu den populärsten Anwendungen im Social-Media-Bereich (vgl. 
Wirtz 2019, 830). Soziale Netzwerke werden definiert als Plattformen, „die com- 
putervermittelte Kommunikation anwenden, um Individuen in Gruppen oder 
Communities miteinander zu verbinden“ (ebd.). Sie bringen „Menschen mit ähn- 
lichen Interessen, aber auch gleichen Wohnorten, Familiensituationen oder Beru- 
fen“ (Pahrmann / Kupka 2020, 309) zueinander, unterstützen ihre Nutzer*innen 
dabei, sich zu vernetzen, Neuigkeiten zu teilen und Beziehungen untereinander 
aufzubauen. 

Das soziale Netzwerk Instagram wurde im Jahr 2010 gegründet. Es ist derzeit 
neben Facebook eines der nutzer*innenstärksten sozialen Netzwerke. Die Haupt- 
anwendung von Instagram liegt im Teilen von qualitativ hochwertigen Fotos und 
Videos. Soziale Netzwerke wie Instagram sind durch die Fokussierung auf Bilder 
und Videos dafür bekannt, den Konsument*innen auf idealtypische Weise Ge- 
schichten aus dem Leben darbieten zu können (Storytelling) und bieten so immer 
mehr Möglichkeiten zur Konstruktion der eigenen Authentizität. 

Die Funktion der Instagram-Stories genießt im Netzwerk Instagram höchste 
Priorität. Es handelt sich um eine der erfolgreichsten Social-Media-Erfindungen 
der letzten Jahre. Nachdem die Funktion im August 2016 eingeführt wurde, gab 
es bereits im Oktober 2017 täglich 200 Millionen aktive Nutzer*innen (vgl. Bet- 
tendorf 2019, 3). 2020 belief sich das Nutzer*innenwachstum auf 500 Millionen 
tägliche Instagram-Story-Konsument*innen (vgl. Internetquelle 3). Die Nut- 
zer*innenzahlen der App Instagram stiegen zudem mit der Einführung der Stories 
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von 6,94 Millionen Nutzer*innen im September 2016 auf 15 Millionen Nut- 
zer*innen im Juni 2017 (vgl. Internetquelle 4). Instagram-Stories wurden entwi- 
ckelt, um Lebensmomente in einer Serie von Bildern und Videos mit Freund*in- 
nen zu teilen (vgl. u. a. Vazquez-Herrero et al. 2019, 3). Die Stories können für 
24 Stunden auf Instagram veröffentlicht und in der Regel nur in diesem Zeitraum 
angesehen werden. Eine Ausnahme stellen sogenannte Highlight-Stories dar, die 
zum Instagram-Profil hinzugefügt werden können und somit dauerhaft sichtbar 
sind (vgl. Bettendorf 2019, 3; Koblike 2019, 35). Diese Kurzlebigkeit bzw. Flüch- 
tigkeit machen die Instagram-Stories zu einem sogenannten ephemeren Mikrofor- 
mat. Dieses beschreibt Inhalte, die nicht beliebig oft oder nur für eine bestimmte 
Zeitspanne angesehen werden können. Ephemere Inhalte sind ein bedeutendes 
Merkmal der gegenwärtigen Medienpraxis (vgl. Kırgova et al. 2020, 2174). 

Instagram wird aufgrund seiner Popularität und Reichweite längst nicht mehr 
ausschließlich von Privatpersonen genutzt, sondern ist auch fester Bestandteil pri- 
vatwirtschaftlicher Marketingstrategien. Einige Unternehmen bauen innerhalb 
des Social-Media-Marketings ihre gesamte Strategie auf Instagram-Stories auf. 
Sie nutzen diese, um Blicke hinter die Kulissen zu geben, die Sichtbarkeit der 
Marke zu verbessern und mit ihrer Community zu interagieren (vgl. Väzquez- 
Herrero et al. 2019, 3). Aufgrund der Prominenz der Instagram-Stories existieren 
zahlreiche Publikationen, die Inspirationen, Vorschläge und Empfehlungen zur 
Gestaltung bzw. zum Content für die perfekte Story geben. Insgesamt soll auf 
Menschlichkeit und Spontaneität gesetzt werden: Der „aufpolierte Glanz einer 
Social Media Kampagne“ (Bettendorf 2019, 35) wird in einer Instagram-Story zu 
„menschlichem Storytelling“ (ebd.) und damit dem Wunsch des Menschen nach 
nahbarer und persönlicher Kommunikation gerecht. 

Dem Gesichtspunkt der „Authentizität“ folgend, erscheint es demzufolge auf- 
schlussreich, digital vermittelte Sprechereignisse in Instagram-Stories aus sprech- 
wissenschaftlicher Perspektive zu beleuchten. Interessant ist hier der Aspekt, in- 
wieweit Sprechausdrucksmerkmale einen Einfluss auf die Authentifizierung der 
Akteur*innen in Instagram-Stories ausüben. 


2.2 YouTube-Videos und der Faktor „Erfolg“ 


Eine weitere Spezialform der Social Media sind Content Communities. Sie sind 
zwar ähnlich aufgebaut wie soziale Netzwerke, doch im Vordergrund steht hier 
das Teilen von Inhalten mit anderen Nutzer*innen und weniger die Kommunika- 
tion der User*innen untereinander. 
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YouTube ist seit Jahren die erfolgreichste Videoplattform im World Wide Web. 
Seit der Gründung 2005 und der Übernahme durch Google eineinhalb Jahre später 
wuchsen die Nutzer*innenzahlen kontinuierlich an. Aktuell erreicht YouTube 
nach eigenen Angaben mehr als 2 Milliarden Menschen in 91 Ländern und 80 
Sprachen (Stand Februar 2021; Internetquelle 5). Auf der Plattform können alle 
angemeldeten Nutzer*innen, die sog. YouTuber*innen, Videos hochladen. An- 
dere Nutzer*innen können die hochgeladenen Videos kommentieren und bewer- 
ten (mittels „Daumen hoch“ oder „Daumen runter“). YouTuber*innen, die Videos 
hochladen, haben jeweils eigene Kanäle, die abonniert werden können, damit man 
informiert wird, wenn ein neues Video dieses Kanals veröffentlicht wurde. 

Wer auf YouTube erfolgreich sein möchte, braucht vor allem zählbare Größen 
wie Klicks, Likes, Abonnements und Kommentare. Da der Erfolg auf YouTube 
nicht nur ein ideeller Wert ist, sondern auch erhebliche monetäre Gewinne mit 
sich bringen kann, streben die meisten YouTuber*innen nach dieser Anerken- 
nung. Doch auch Nutzer*innen, die keine Gewinne erzielen wollen, sind gezwun- 
gen, bestimmte Strategien anzuwenden, damit ihr Video überhaupt innerhalb der 
Milliarden auf der Plattform vorhandenen Videos gefunden werden kann. Eine 
zentrale Rolle spielen dabei die Bewertungsalgorithmen: Wird ein Video oft an- 
geklickt und erhält viele positive Bewertungen, sorgt ein Algorithmus dafür, dass 
dieses Video präsenter in den Vorschlägen und Suchergebnissen platziert wird, 
was wiederum begünstigt, dass das Video noch öfter angeklickt und gelikt wird. 
Welbourne und Grant sprechen dabei von einem „rich-get-richer popularity sce- 
nario“ (2016, 707). Die Gestaltung der erfolgreichen Videos prägt allein aufgrund 
ihrer Präsenz die Erwartung vieler Nutzer*innen an „gute“ Videos und wirkt als 
Vorbild für andere YouTuber*innen (vgl. Ebel 2020a, 4). Aus sprechwissen- 
schaftlicher Sicht ist es daher interessant, ob sich bestimmte Ausprägungen in der 
Nutzung von Sprechausdrucksmerkmalen herausbilden, die in erfolgreichen Vi- 
deos häufiger zu finden sind als in weniger erfolgreichen Videos. 


3 Sprechwirkungsuntersuchungen in Social-Media-Formaten 


3.1 Authentizität in Instagram-Stories 


Authentizität ist im Kontext medienvermittelter Kommunikation vor allem für 
Social Media zu einem substanziellen Leitthema geworden. In dieser Debatte 
steht im Besonderen das soziale Netzwerk Instagram samt der Funktion der Ins- 
tagram-Stories hoch im Diskurs. Es wird angenommen, dass der Erfolg der Insta- 
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gram-Stories stark mit der Ausprägung einer charakteristischen Authentizität ver- 
bunden sei. Authentizitätsabhandlungen können sich auf Abstrakta, Objekte, Per- 
sonen u. v. m. beziehen. Diese vorzustellende Untersuchung beschränkt sich auf 
Authentifizierungen von Sprecher*innen, die in Instagram-Stories vor der Ka- 
mera agieren. Die konkrete Fragestellung lautet, ob Sprecher*innen in Instagram- 
Stories Authentizität zugeschrieben wird oder nicht. 


3.1.1 Korpus 


Für die Untersuchung sind jeweils ein Sprecher und eine Sprecherin einer Insta- 
gram-Story ausgewählt worden. Da die authentische Charakteristik der Insta- 
gram-Stories insbesondere für Unternehmen als aussichtsreich gilt und diese teil- 
weise viel Wert auf Instagram-Marketing legen, sind speziell solche Stories 
ausgewählt worden, die von einem Instagram-Business-Account veröffentlicht 
wurden. Die Namen der Unternehmen, auf deren Accounts Sprecher und Spre- 
cherin in den Instagram-Stories zu sehen sind, werden hier anonymisiert. Ein wei- 
teres Auswahlkriterium war, dass die Personen während der Präsentation von Pro- 
duktneuheiten des Unternehmens in die Kamera sprechen, sodass Gesicht und 
Teile des Oberkörpers gut erkennbar sind. Außerdem wurde das Alter der Spre- 
chenden berücksichtigt, da vor allem jüngere Personen, die einen möglichst „läs- 
sigen“ Eindruck hinterlassen, als besonders erfolgsversprechend für authentische 
Instagram-Stories gelten (vgl. Bettendorf 2019, 23). Sprecherin und Sprecher des 
Korpus wurden im Vorfeld der Untersuchung auf ein Alter zwischen 25 und 30 
geschätzt. Die Story, in der der Sprecher agiert, wurde am 28.09.2020 veröffent- 
licht und besteht aus fünf Videosequenzen à 15 Sekunden, die Story mit der Spre- 
cherin ist vom 20.09.2020 und dauert acht Videosequenzen à 15 Sekunden. 


3.1.2 Untersuchungsdurchführung 


Im Rahmen der empirischen Untersuchung wurden mittels einer Online-Fragebo- 
generhebung insgesamt 86 Teilnehmer*innen befragt, davon 56 weibliche, 29 
männliche und eine Person, die sich der Kategorie divers zuordnete. Knapp 90 % 
der Teilnehmer*innen sind zwischen 18 und 34 Jahre alt und drei Viertel der Be- 
fragten nutzen die Social Media App Instagram. Jede*r Neunte davon nutzt die 
Funktion Instagram-Stories einmal oder mehrmals täglich. Die Stories des Korpus 
wurden zuvor mit dem Smartphone als sog. Screencasts mitgeschnitten und in den 
Online-Fragebogen eingefügt, sodass die Teilnehmer*innen diese abspielen 
konnten. Zunächst sollten die Proband*innen die Authentizität von Sprecher und 
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Sprecherin hinsichtlich sogenannter Authentizitäts- bzw. Inauthentizitätskriterien 
bewerten, die ihnen in Form eines Polaritätenprofils (vgl. Abb. 1) vorlagen. Die 
Items dieses Profils wurden auf Basis der in der Forschungsliteratur genannten 
Kriterien zur Authentifizierung eines Individuums erstellt (vgl. Keller 2009, 
334 ff.; Kugler / Kurt 2000, 153 f., Knaller / Müller 2006, 7 ff.; Deppermann 
2000, 262 f.; Ulrich 2012, 80 £.). Kriterien für die Zuschreibung von Inauthenti- 
zität waren allerdings in der Literatur nur spärlich zu ermitteln, obwohl sie als 
„notwendige andere Seite der Unterscheidung“ (Keller 2009, 336) für Authenti- 
fizierungen essentiell seien. Daher wird von der Untersuchungsleiterin zu jedem 
Item des Authentischen ein funktionales Äquivalent vorgeschlagen, woraus sich 
folgendes Polaritätenprofil ergibt: 


echt unecht 
glaubwürdig zweifelhaft 
ungekünstelt affektiert 
autoritär unterwürfig 
originell imitiert 
zuverlässig unzuverlässig 
wahrhaftig trügerisch 
authentisch inszeniert 
aufrichtig falsch 
improvisiert strategisch 
natürlich verstellt 
ehrlich lügnerisch 


Abb. 1: Polaritätenprofil mit (In-)Authentizitätskriterien 


Die aus dem Polaritätenprofil resultierende Authentifizierung lässt sich mit den 
erhobenen Angaben zur Erfahrung mit der App sowie mit den Unternehmen, zur 
Einstellungshomophilie, zu soziodemographischen Merkmalen sowie zum 
Sprechausdruck von Sprecher und Sprecherin in Beziehung setzen. Die Ergebnis- 
darstellung innerhalb des vorliegenden Beitrags nimmt hauptsächlich den Faktor 
Sprechausdruck in den Fokus und wertet diesen als einflussnehmendes Kriterium 
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für die Authentifizierung in Instagram-Stories. Dafür hat die Untersuchungsleite- 
rin den Sprechausdruck beider Story-Sprecher*innen anhand des „Katalogs zur 
auditiven Merkmalsbeschreibung von Sprechausdrucksmustern“ nach Bose 
(2001, 301 ff.) analysiert. 


3.1.3 Ergebnisse 


Die Authentizität beider Sprecher*innen wurde von den Proband*innen unter- 
schiedlich wahrgenommen. Der Sprecher wurde insgesamt als authentischer ein- 
gestuft als die Sprecherin. Es konnte festgestellt werden, dass ein Sprechausdruck, 
der geplant und geschult wirkt, ähnlich wie bei Moderationen in Morningshows 
(vgl. Kap. 1.2) auch bei den Instagram-Stories ein ausschlaggebender Faktor für 
eine Inauthentizitätsbewertung zu sein scheint. So zeigt die als eher inauthentisch 
wahrgenommene Sprecherin eine hohe Artikulationspräzision sowie eine starke 
Resonanz im Stimmklang — Kriterien, die auf einen geschulten Sprechausdruck 
hindeuten. Die Artikulation des Sprechers hingegen ist verständlich und deutlich, 
aber nicht so präzise wie die der Sprecherin. In der Resonanz zeigt der Sprecher 
eine nur durchschnittlich hohe Klangfülle. Des Weiteren fällt auf, dass die Stimm- 
absätze durch beide Sprecher*innen oft knarrend realisiert werden. Vor allem in 
der Stimme der Sprecherin sind brüchige sowie raue Anteile deutlich hörbar. Ihr 
Sprechausdruck ist sehr kontrastreich, vor allem im zeitlichen Verlauf der Insta- 
gram-Story. Insbesondere die Sprechtonhöhe wechselt in Abhängigkeit vom In- 
halt des Gesagten stark. Ein kontrastreicher Sprechausdruck z. B. aufgrund von 
Tempo- und Lautheitswechseln sowie Rauigkeitsanteilen in der Stimme kenn- 
zeichnet im Rahmen von Moderationen in Morningshows einen Eindruck von 
Authentizität. Im Format Instagram-Stories könnten diese Merkmale eher Krite- 
rien für Inauthentizität sein, denn sie wurden vorrangig von der Sprecherin reali- 
siert, die als weniger authentisch beurteilt wurde. 


3.2 Sprechausdruck als Erfolgsfaktor in YouTube-Videos 


Wie bereits unter 2.2 erwähnt wurde, ist Erfolg eine der wichtigsten Größen zur 
Beurteilung von YouTube-Videos. Da YouTube zu den sozialen Medien gehört, 
ist davon auszugehen, dass nicht nur inhaltliche oder visuelle Aspekte über den 
Erfolg eines Videos bestimmen, sondern dass auch die Sprechwirkung der You- 
Tuber*innen zu einer positiven Wirkung beitragen kann und somit die Erfolgs- 
chancen eines Videos gesteigert werden können. Aus diesen Überlegungen ergibt 
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sich die Untersuchungsfrage, ob Sprechausdrucksmerkmale in bestimmten Aus- 
prägungen häufiger in erfolgreichen bzw. in weniger erfolgreichen Videos zu fin- 
den sind. Um sich dieser Frage zu nähern, wurde im Rahmen eines BA-Seminars 
im Studiengang Sprechwissenschaft und Phonetik der Martin-Luther-Universität 
Halle-Wittenberg eine Analyse vorgenommen, aus der sich erste Tendenzen ab- 
leiten lassen. 


3.2.1 Korpus 


Das Korpus besteht aus 40 YouTube-Videos (insges. 385 Minuten), in denen Wis- 
sen zu schulisch und/oder universitär relevanten Themen vermittelt wird, z. B. als 
Anleitung zum Verfassen einer Gedichtanalyse, als Zusammenfassung der Fran- 
zösischen Revolution oder als Erklärung der Bilanz in T-Konten. Die Videos wur- 
den so ausgewählt, dass verschiedene Fachgebiete abgedeckt werden. Zudem ist 
das Korpus zweigeteilt in jeweils ein erfolgreiches und ein weniger erfolgreiches 
Video pro Thema. Diese Qualitätszuschreibung wurde zunächst an rein formalen 
Kriterien wie Klickzahlen, Anzahl und Art der Kommentare sowie „Daumen hoch 
bzw. runter“-Bewertungen ausgemacht (vgl. dazu auch Bachl 2011, 159 ff.). 


3.2.2 Untersuchungsdurchführung 


Für die auditive Beurteilung wurde ebenfalls der „Katalog zur auditiven Merk- 
malsbeschreibung von Sprechausdrucksmustern“ von Bose (2001, 301 f.) als 
Grundlage genommen. In insgesamt fünf Seminarsitzungen wurde gemeinsam 
mit den Studierenden eine Einschätzung ausgewählter Videos des Korpus anhand 
des Katalogs vorgenommen. In den sich dabei ergebenden Diskussionen wurden 
terminologische Unklarheiten ausgeräumt und es fand eine Eichung statt, wann 
von einer bestimmten Merkmalsausprägung (insbesondere von den jeweiligen 
Extrempolen) ausgegangen werden kann. Durch die intensive Auseinanderset- 
zung mit dem Analyseinstrument wurden daran auch Änderungen durch die 
Gruppe vorgenommen. Diese betreffen einerseits die Skalenbenennungen und an- 
dererseits die zu beurteilenden Merkmale selbst. Folgende Änderungen ergaben 
sich im Vergleich zum ursprünglichen Merkmalskatalog: 


- Die Geschwindigkeit wurde unterteilt in Sprechgeschwindigkeit (inkl. Pau- 


sen) und Artikulationsgeschwindigkeit (exkl. Pausen). Messungen hatten 
im Vorfeld ergeben, dass insbesondere in Videos durch Handlungspausen 
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größere Unterschiede zwischen der Sprechgeschwindigkeit und der Artiku- 
lationsgeschwindigkeit auftreten können (vgl. Ebel 2020b, 36 f.). Es sollte 
nun überprüft werden, ob diese Unterschiede auch auditiv wahrgenommen 
werden. 

- Das Merkmal Lippenaktivität wurde im Block „Artikulation“ ergänzt, da 
zusätzlich zur Lippenstellung auch eine Rolle spielt, wie stark die*der 
Sprecher*in überhaupt die Lippen beim Sprechen nutzt. Die Skalenbenen- 
nung der Ausprägungen wurden festgelegt als „sehr stark; stark; mittel; 
schwach; sehr schwach“. 

- Äquivalent zu den Merkmalen Tonhöhenverlauf (zeitlich), Lautheitsver- 
lauf (zeitlich), Stimmklangmodifikation (zeitlich) und Geschwindigkeits- 
verlauf (zeitlich), die bereits im Katalog vorhanden waren, wurde das 
Merkmal Sprechrhythmusverlauf (zeitlich) ergänzt. Dadurch kann angege- 
ben werden, ob der Sprechrhythmus über die Dauer eines Sprechereignis- 
ses gleich bleibt oder sich häufig verändert. Die Benennungen der Ausprä- 
gungen wurden entsprechend der anderen genannten Merkmale als „sehr 
wechselnd; wechselnd; mittel; gleichförmig; sehr gleichförmig“ festgelegt. 

- Beim Merkmal Spannungsbögen wurden die Ausprägungen umbenannt. 
Die Gruppe kam zu dem Schluss, dass es wichtiger wäre zu bewerten, ob 
die Spannungsbögen überhaupt die Sinneinheiten unterstützen, also ihnen 
entsprechen, als nur die Einheitlichkeit der Spannungsbögen einzuschät- 
zen. Daher wurden folgende drei Benennungen gewählt: „unterstützen 
Sinneinheiten; unterstützen Sinneinheiten nicht; keine“. 

- Zuletzt wurde das Merkmal Ansprechhaltung mit den Ausprägungen „ge- 
richtet; ungerichtet; wechselnd“ ergänzt. Mit wechselnder Ansprechhal- 
tung ist gemeint, dass diese über die Gesamtdauer des Videos weder durch- 
gängig gerichtet noch ungerichtet ist, sondern die Gerichtetheit schwankt. 
Der Grund für die Ergänzung ist, dass die Ansprechhaltung, die ein wich- 
tiges Merkmal für die Beurteilung der Zugewandtheit einer sprechenden 
Person darstellt (vgl. Ebel (eingereicht)), als möglicher Erfolgsfaktor nicht 
fehlen sollte. 


Anhand dieses modifizierten Merkmalskatalogs beurteilten jede*r Student*in je- 
weils ein Video. Die Studierenden wussten während der Beurteilung nicht, ob es 
sich um ein erfolgreiches oder ein weniger erfolgreiches Video handelt. Aufgrund 
der Subjektivität (die durch den Eichungsprozess möglicherweise etwas verrin- 
gert werden konnte) und wegen der geringen Fallzahlen können im Folgenden nur 
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Tendenzen aufgezeigt werden. Die Ergebnisse sollten in Zukunft durch weitere 
auditive Analysen anhand eines größeren Korpus überprüft werden. 


3.3 Ergebnisse 


Für den Großteil der Sprechausdrucksmerkmale zeigten sich keine eindeutigen 
Hinweise darauf, dass eine bestimmte Ausprägung eher in erfolgreichen oder we- 
niger erfolgreichen Videos zu finden ist. Fünf der untersuchten Merkmale zeigen 
allerdings Tendenzen, die in der nachfolgenden Tabelle aufgeführt sind: 


Sprechausdrucksmerkmal erfolgreiche Videos weniger erfolgreiche Videos 
Klangfülle mittel bis klangvoll klangarm bis mittel 
Faukale Distanz mittel eng 
Artikulationspräzision präzise mittel bis unpräzise 
Lippenaktivität mittel bis stark schwach bis mittel 
Sprechrhythmusverlauf keine Angabe gleichförmig 


Tab. 1: Eindeutig ausgeprägte Sprechausdrucksmerkmale im Lernvideo-Korpus 


Die Ergebnisse weisen darauf hin, dass in erfolgreichen Videos die Sprecher*in- 
nen verstärkt Merkmale geschulten Sprechens. Hingegen waren in den untersuch- 
ten weniger erfolgreichen Videos vermehrt Sprecher*innen mit weniger klang- 
vollen Stimmen, geringerer Lippenaktivität und u.a. daraus resultierender 
unpräziser Artikulation zu finden, die außerdem wenig rhythmisch variierten. 
Diese Ausprägungen der Sprechausdrucksmerkmale könnten — besonders in 
Kombination miteinander — dazu führen, dass die Sprecher*innen weniger moti- 
viert oder zugewandt wirken und ihre Videos deshalb weniger erfolgreich sind. 
Allerdings zeigte die Beurteilung des Merkmals Ansprechhaltung diesbezüglich 
keine tendenziell eindeutigen Ergebnisse, auch weil oft die Merkmalsausprägung 
„wechselnd“ gewählt wurde. Dennoch scheint es empfehlenswert zu sein, in den 
Kommentaren, die andere YouTube-Nutzer*innen zu den Videos abgegeben ha- 
ben, nach Hinweisen auf die Sprechwirkung zu suchen. Daran ließe sich überprü- 
fen, ob die aus der Einschätzung der Sprechausdrucksparameter angenommenen 
Effekte tatsächlich von den Rezipient*innen empfunden und formuliert werden 
(vgl. auch Ebel 2021). 
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4 Fazit und Ausblick 


Der Sprechausdruck spielt eine zentrale Rolle in Bezug auf die Wirkung einer 
sprechenden Person. Neben prosodischen Parametern haben dabei auch segmen- 
tale artikulatorische Merkmale einen Einfluss. Zur Sprechwirkung von Medien- 
akteur*innen aus elektronischen Medien gibt es bereits Studien — hauptsächlich 
aus dem Bereich der Radioästhetik. Die Frage war, inwieweit die dort gewonne- 
nen Ergebnisse auf Personen, die über digitale Massenmedien, speziell soziale 
Medien kommunizieren, übertragen werden können. Die Besonderheiten der 
Kommunikation über Social Media liegen darin, dass dort jeder zu potenziellen 
Produzent*innen werden kann und dass positive Bewertungen durch andere Nut- 
zer*innen über den Erfolg eines Beitrags entscheiden. Im vorliegenden Text wur- 
den zwei empirische Analysen vorgestellt, die den Einfluss von Sprechaus- 
drucksparametern in Social-Media-Kommunikation untersuchen. Konkret 
wurden das soziale Netzwerk Instagram und die Content Community YouTube in 
den Blick genommen. 

Im Hinblick auf Instagram wurde untersucht, ob der Sprechausdruck relevant 
ist für die Authentifizierung einzelner Instagrammer*innen, also ob andere Nut- 
zer*innen ihnen eine authentische Wirkung zuschreiben oder nicht. Insbesondere 
in Instagram-Stories, die sich durch Storytelling auszeichnen, ist der Wunsch der 
User*innen nach persönlicher und nahbarer Kommunikation groß. In den unter- 
suchten Stories konnte ein Befund aus der Radioästhetikforschung zu Moderatio- 
nen in Morningshows auf Jugendsendern bestätigt werden: Sprecher*innen, deren 
Sprechweise geschult wirkt, werden als weniger authentisch wahrgenommen. An- 
dererseits wurden auch geknarrte Stimmabsätze, Rauigkeitsanteile in der Stimme 
sowie häufige Tempo- und Lautheitswechsel im Rahmen der Untersuchung als 
Kriterien für die Beurteilung von Inauthentizität erkennbar, worin ein Unterschied 
zu den Ergebnissen der Moderationsanalysen der Radioästhetikforschung besteht. 
Die Ergebnisse sowie Interpretationen stützen sich zunächst auf eine sehr kleine 
Stichprobe. Es lassen sich für dieses Format daher nur Tendenzen in der Abhän- 
gigkeit von Authentifizierung und Sprechausdruck ableiten. Außerdem bleiben 
die Authentizitätskriterien, die auf Basis der Literatur zusammengetragen wurden, 
diskutabel. Weitere Vorschläge und Ergänzungen für (In-)Authentizitätskriterien, 
an denen sich die Authentifizierung misst, könnten in nachfolgenden Untersu- 
chungen ermittelt werden. Die Untersuchung konnte einen Grundstein für die 
Analyse von Instagram-Stories in der Sprechwirkungsforschung legen. Neben ei- 
ner größeren Anzahl von Stories mit verschiedenen Sprecher*innen, die von einer 
breiteren Proband*innengruppe zu analysieren wären, könnten weiterführende 
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Analysen unterschiedliche Ausprägungen des Sprechausdrucks für dieses Format, 
auch unabhängig vom Faktor „Authentizität“, noch eingehender evaluieren. 

In Bezug auf YouTube wurde geprüft, ob es einen charakteristischen Sprech- 
ausdruck gibt, der vorrangig in erfolgreichen Videos zu finden ist. Die Ergebnisse 
weisen darauf hin, dass, anders als für Rundfunkmoderator*innen in Mornings- 
hows ermittelt, diejenigen Videos auf YouTube erfolgreicher sind, in denen Spre- 
cher*innen mit geschulten Stimmen zu hören sind. Eine naheliegende Erklärung 
könnte sein, dass das Untersuchungskorpus aus Lernvideos bestand, in denen es 
weniger um Unterhaltung, sondern eher um Informationsübermittlung und Ver- 
ständlichkeit geht (vgl. Ebel 2021). Der Unterscheidung Schönfelders (1987, 
235 f.) folgend, lässt sich davon ausgehen, dass Lernvideos einen eher unterrich- 
tenden, informierenden oder belehrenden Charakter haben. Morningshows hinge- 
gen wären demnach eher interpretationsoffen und unterhaltend (vgl. auch Ebel 
(eingereicht)). An dieser Stelle könnten weitere Untersuchungen ansetzen, die den 
Sprechausdruck und dessen Wirkung in anderen YouTube-Genres in den Blick 
nehmen. 


Abschließend lässt sich resümieren, dass Sprechereignisse in sozialen Medien 
aufgrund deren enormer Beliebtheit, Hochaktualität und Zukunftsperspektiven als 
Forschungsfeld große Potenziale bieten. Videos, die weltweit „viral gehen“, oder 
Stimmen, die innerhalb von Videos auf TikTok imitiert werden, könnten hinsicht- 
lich sprecherischer Besonderheiten betrachtet werden. Die Untersuchung von In- 
teraktionen in den sogenannten „Rooms“ der neuen Social-Media-App Clubhouse 
könnte auch im Bereich der Gesprächsanalyse ein neues Forschungsfeld darstel- 
len. 
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